LLM je sljedeći JPEG
Dopustite mi da vam ispričam priču.
Devedesetih godina, ako ste htjeli poslati fotografiju nekome, morali ste razmišljati o mnogo toga: formatu datoteke, algoritmu kompresije, dubini boja. Svaki je softver imao svoj format. Onda se pojavio JPEG.
Odjednom, nikoga više nije bilo briga za format slike. JPEG je postao infrastruktura. Ne biste rekli "Napravio sam sliku s JPEG-om", samo biste rekli "Poslao sam sliku".
LLM ide istim putem.
Kada tehnologija postane zrak
"LLM je roba. Apple rado kupuje tokene od LLM tvrtki, ali Apple je tvrtka koja prodaje diferencirane proizvode." — @deuteronormative
Ova rečenica je izravna. Ako ste Apple, nećete sami proizvoditi električnu energiju, kupujete je iz električne mreže. Nećete sami proizvoditi gume, kupujete ih od Michelina. Sada, nećete sami trenirati LLM, kupujete tokene iz oblaka.
To ne znači da LLM nije važan. Električna energija je važna. Gume su važne. Ali one su infrastruktura, a ne faktor diferencijacije.
Pobjednik u ratu troškova
Alibaba je upravo objavila Qwen 3.5:
- 397 milijardi parametara, 17 milijardi aktivacija
- 60% jeftiniji od Qwen 3
- 8 puta brži
- Cijena tokena je 1/18 cijene Gemini 3 Pro
Ovo nije tehnološki proboj, ovo je rat cijenama. Tako su i LCD televizori pojeftinili tih godina. Prva tvrtka koja je pala ispod 1000 dolara nije bila tehnološki najbolja, ali je bila pobjednik.
Pragmatični savjeti
Što to znači ako ste programer?
-
Nemojte sami trenirati modele. Osim ako niste OpenAI, Anthropic ili Alibaba, treniranje modela je bacanje novca. Koristite API.
-
Fokusirajte se na cijenu, a ne na parametre. 397 milijardi parametara zvuči cool, ali vaše korisnike to ne zanima. Njih zanima brzina odziva i cijena.
-
Budite spremni za migraciju. LLM je roba, što znači da je zamjenjiv. Danas koristite GPT, sutra Claude, prekosutra Qwen. Vaša arhitektura bi trebala podržavati takvu promjenu.
Zanimljiv paradoks
Oni koji najbolje razumiju LLM najmanje govore o LLM-u.
"Andrej Karpathy je napisao mini GPT u 240 redaka čistog Pythona. Bez TensorFlowa. Bez PyTorcha. Samo matematika. To pokazuje da LLM nije magija - oni su samo predviđanje sljedećeg tokena."
Kada shvatite da je "predviđanje sljedećeg tokena" sve što ova tehnologija jest, puno hypea nestaje. Ovo nije omalovažavanje. Mikrovalna pećnica samo zagrijava molekule vode, ali je promijenila kuhinju.
Sljedeći korak
LLM će postati nešto poput JPEG-a: sveprisutan, nitko ne raspravlja o njemu, ali je neophodan.
Do tada, pametni ljudi će odabrati najjeftinijeg dobavljača u ratu cijenama. Jer kada tehnologija postane roba, jedino što je važno je cijena.





