GPTのコストの壁

2/17/2026
1 min read

過去一週間、X(旧Twitter)上でのGPTに関する議論の焦点は、能力ではなくコストに移ってきました。

ARC-AGI:知能の境界

現在最先端のモデルのARC-AGI-2でのパフォーマンス:

モデルARC-AGI-2 スコア
GPT-5.2 Pro~54%
GPT-5.2 Refine~73%
人類100%

54%から73%の差は知能の問題ではなく、「精錬」——モデルに自分の答えを繰り返しチェックさせることです。これにはより多くの計算が必要となり、より高いコストを意味します。

Agentの真のコスト

24時間365日稼働するエンタープライズレベルのAgent(1日あたり2000万入力 + 2000万出力トークン)の年間コスト:

モデル年間コスト
Palmyra X5~$48K
GPT-5.2 Standard~$57K
Gemini 2.5 Pro~$82K
Claude Sonnet 4.5~$131K
Claude Opus 4.6~$219K
GPT-5.2 Pro~$690K

GPT-5.2 ProはGPT-5.2 Standardより12倍高いです。これは価格設定戦略の問題ではなく、コスト構造の問題です。

"Before you deploy 100 AI agents, run the math." — @waseem_s (100個のAIエージェントをデプロイする前に、計算を実行してください。)

新しいチューリングテスト

簡単な質問が新しい知能テストになりつつあります:

「洗車場は私の家から40メートル離れています。洗車したいのですが、歩いて行くべきですか、それとも車で行くべきですか?」

合格したモデル: GPT-5.2 Thinking, Opus 4.6, Gemini 3 Pro 失敗したモデル: GPT-5.2 Instant, GPT-4o, Haiku 4.5, Sonnet 4.5

なぜこのテストが意味があるのでしょうか?それは「常識推論」をテストしているからです。「知識検索」ではありません。40メートルは歩ける距離です。車は汚れていて洗う必要があります。しかし、汚れた車を40メートル運転して洗車に行くことはありません——常識がなければ別ですが。

歴史は繰り返さないが、韻を踏む

"専門家システムは1970年代に誕生し、1980年代に隆盛を極め、AIの未来として広く認識されました。" — @ChombaBupe (専門家システムは1970年代に誕生し、1980年代に隆盛を極め、AIの未来として広く認識されました。)

GPTモデルは2018年に誕生し、2020年代に隆盛を極め、AIの未来として広く認識されています。

専門家システムの失敗は、十分に賢くなかったからではなく、維持コストが高すぎ、拡張性が低すぎたからです。知識ベースを手動でメンテナンスする必要がある場合、規模は敵となります。

GPTが直面しているのは鏡像の問題です:モデルは賢いですが、推論コストが高すぎます。各リクエストに大量の計算が必要な場合、規模は同様に敵となります。

次のステップ

今週は複数の新しいモデルがリリースされる予定です:Gemini 3.1 Pro、Claude Sonnet 5、GPT-5.3、DeepSeek V4、Qwen 3.5。

競争は「誰がより賢いか」から「誰がより安いか」へと移行しています。これはユーザーにとっては良いニュースです。OpenAIにとっては?必ずしもそうではありません。

Published in Technology

You Might Also Like

📝
Technology

Claude Code Buddy 修正ガイド:どのようにしてシャイニングレジェンド級ペットを手に入れるか

Claude Code Buddy 修正ガイド:どのようにしてシャイニングレジェンド級ペットを手に入れるか 2026年4月1日、Anthropic は Claude Code 2.1.89 バージョンでひっそりとエッグ機能を追加しました——...

ObsidianはDefuddleを発表し、Obsidian Web Clipperを新たな高みへと引き上げたTechnology

ObsidianはDefuddleを発表し、Obsidian Web Clipperを新たな高みへと引き上げた

ObsidianはDefuddleを発表し、Obsidian Web Clipperを新たな高みへと引き上げた 私はObsidianのコア理念がとても好きです:ローカルファースト、すべてはファイル、そして単純なMarkdownテキストファ...

OpenAIが突然発表した「三合一」:ブラウザ+プログラミング+ChatGPTの統合、内部で過去1年の誤りを認めるTechnology

OpenAIが突然発表した「三合一」:ブラウザ+プログラミング+ChatGPTの統合、内部で過去1年の誤りを認める

OpenAIが突然発表した「三合一」:ブラウザ+プログラミング+ChatGPTの統合、内部で過去1年の誤りを認める 2026年3月19日深夜、OpenAI本社から内部メモが流出し、『ウォール・ストリート・ジャーナル』が真っ先に原文を入手し...

2026年、自分を「自律」に縛らない!この8つの小さなことを実践すれば、健康は自然にやってくるHealth

2026年、自分を「自律」に縛らない!この8つの小さなことを実践すれば、健康は自然にやってくる

2026年、自分を「自律」に縛らない!この8つの小さなことを実践すれば、健康は自然にやってくる 新しい年が始まりましたが、昨年立てた目標は達成できましたか?毎年「やる気満々」と「諦めたい」の間で揺れ動いていませんか? 2026年、考え方を...

努力しても痩せられないママたち、絶対にここでつまずいているHealth

努力しても痩せられないママたち、絶対にここでつまずいている

努力しても痩せられないママたち、絶対にここでつまずいている 3月も半ばを過ぎましたが、あなたのダイエット計画はどうですか?痩せましたか?どれくらい痩せましたか? 私のダイエット経験 2月末にダイエットを決意してから、実際にはどんどん体重...

📝
Technology

AIブラウザ 24時間安定運用ガイド

AIブラウザ 24時間安定運用ガイド 本チュートリアルでは、安定して長期間運用できるAIブラウザ環境の構築方法を紹介します。 対象 AIエージェント 自動化ブラウジング Web自動化 AIアシスタント 自動テストシステム 目標 ブラウザを...