LLMは次のJPEG
物語をさせてください。
1990年代、もしあなたが写真を誰かに送りたいなら、多くのことを考慮する必要がありました:ファイル形式、圧縮アルゴリズム、色の深度。それぞれのソフトウェアが独自の形式を持っていました。そしてJPEGが登場しました。
突然、誰も画像形式を気にしなくなりました。JPEGはインフラになりました。「JPEGで画像を作った」とは言わず、「画像を送信した」と言うだけです。
LLMは同じ道を歩んでいます。
技術が空気になるとき
"LLMは商品です。AppleはLLM企業からトークンを購入することを喜んでいますが、Appleは差別化された製品を販売する会社です。" — @deuteronormative
この言葉は率直です。もしあなたがAppleなら、自分で発電はせず、電力網から電気を買います。自分でタイヤを作ることはせず、ミシュランからタイヤを買います。今、あなたは自分でLLMを訓練することもせず、クラウドからトークンを買います。
これはLLMが重要ではないという意味ではありません。電気は重要です。タイヤは重要です。しかし、それらはインフラであり、差別化要因ではありません。
コスト競争の勝者
アリババが発表したQwen 3.5:
- 3970億パラメータ、170億アクティブ
- Qwen 3より60%安い
- 速度が8倍速い
- Token価格はGemini 3 Proの1/18
これは技術的なブレークスルーではなく、価格競争です。かつて液晶テレビもこのように値下げされました。最初に1000ドルを切った企業は技術的に最高ではありませんでしたが、勝者でした。
実用的なアドバイス
もしあなたが開発者なら、これは何を意味するのでしょうか?
-
自分でモデルを訓練しない。あなたがOpenAI、Anthropic、またはアリババでない限り、モデルを訓練するのはお金の無駄です。APIを使用してください。
-
パラメータではなく価格に注目する。3970億パラメータはクールに聞こえますが、あなたのユーザーは気にしません。彼らが気にするのは応答速度とコストです。
-
移行の準備をする。LLMは商品であり、交換可能であることを意味します。今日はGPTを使い、明日はClaudeを使い、明後日はQwenを使う。あなたのアーキテクチャは、このような切り替えをサポートする必要があります。
面白いパラドックス
LLMを最もよく知っている人は、LLMについてあまり語りません。
"Andrej Karpathyは240行の純粋なPythonでミニGPTを書きました。TensorFlowはありません。PyTorchはありません。数学だけです。それはLLMが魔法ではないことを示しています——それらは単なる次のトークン予測です。"
「次のトークン予測」がこの技術のすべてであると理解したとき、多くの誇大宣伝は消えます。これは軽蔑ではありません。電子レンジは水分子を加熱するだけですが、それはキッチンを変えました。
次のステップ
LLMはJPEGのようなものになるでしょう:どこにでもあり、誰も議論しませんが、不可欠です。
それまでは、賢い人は価格競争で最も安いサプライヤーを選ぶでしょう。なぜなら、技術が商品化されると、唯一重要なのはコストだからです。





