LLM ni JPEG Inayofuata
Acha niwaeleze hadithi.
Katika miaka ya 1990, ikiwa unataka kumtumia mtu picha, ulihitaji kuzingatia mambo mengi: umbizo la faili, algorithm ya kubana, kina cha rangi. Kila programu ilikuwa na umbizo lake. Kisha JPEG ilikuja.
Ghafla, hakuna mtu aliyekuwa akijali umbizo la picha tena. JPEG ikawa miundombinu. Husemi "Nilitengeneza picha kwa kutumia JPEG", unasema tu "Nimetuma picha".
LLM inaelekea njia hiyo hiyo.
Wakati Teknolojia Inakuwa Hewa
"LLM ni bidhaa. Apple ingefurahi kununua tokens kutoka kwa kampuni za LLM, lakini Apple ni kampuni inayouza bidhaa tofauti." — @deuteronormative
Kauli hii inasema wazi. Ikiwa wewe ni Apple, hautazalisha umeme wako mwenyewe, unanunua umeme kutoka kwa gridi ya taifa. Hautatengeneza matairi yako mwenyewe, unanunua matairi kutoka Michelin. Sasa, hautafunza LLM yako mwenyewe, unanunua tokens kutoka wingu.
Hii haisemi kwamba LLM si muhimu. Umeme ni muhimu. Matairi ni muhimu. Lakini ni miundombinu, si sababu ya utofauti.
Mshindi wa Vita vya Gharama
Qwen 3.5 iliyotolewa hivi karibuni na Alibaba:
- Vigezo bilioni 397, uanzishaji bilioni 17
- 60% nafuu kuliko Qwen 3
- Kasi mara 8 zaidi
- Bei ya Token ni 1/18 ya Gemini 3 Pro
Hii si mafanikio ya kiteknolojia, ni vita vya bei. Televisheni za LCD zilipungua bei kwa njia hii hiyo. Kampuni ya kwanza kushuka chini ya dola 1000 haikuwa bora kiteknolojia, lakini ilikuwa mshindi.
Ushauri wa Kimatendo
Ikiwa wewe ni msanidi programu, hii inamaanisha nini?
-
Usifunze modeli yako mwenyewe. Isipokuwa wewe ni OpenAI, Anthropic au Alibaba, kufunza modeli ni kuchoma pesa. Tumia API.
-
Zingatia bei badala ya vigezo. Vigezo bilioni 397 vinaonekana vizuri, lakini watumiaji wako hawajali. Wanajali kasi ya majibu na gharama.
-
Uwe tayari kuhamia. LLM ni bidhaa, ambayo inamaanisha inaweza kubadilishwa. Leo tumia GPT, kesho tumia Claude, kesho kutwa tumia Qwen. Usanifu wako unapaswa kuunga mkono ubadilishaji huu.
Kitendawili cha Kuvutia
Watu wanaoelewa LLM zaidi hawazungumzii sana kuhusu LLM.
"Andrej Karpathy aliandika GPT ndogo kwa mistari 240 ya Python safi. Hakuna TensorFlow. Hakuna PyTorch. Hisabati tu. Inaonyesha kuwa LLM si uchawi - ni utabiri wa token inayofuata tu."
Unapoelewa kuwa "utabiri wa token inayofuata" ndio teknolojia yote, msisimko mwingi hupotea. Hii si kudharau. Microwave ni kuongeza joto molekuli za maji, lakini inabadilisha jikoni.
Hatua Inayofuata
LLM itakuwa kitu kama JPEG: kila mahali, hakuna mtu anayejadili, lakini ni muhimu.
Hadi wakati huo, watu werevu watachagua muuzaji wa bei nafuu katika vita vya bei. Kwa sababu teknolojia inapokuwa bidhaa, jambo pekee muhimu ni gharama.

