LLM je sljedeći JPEG

2/17/2026
3 min read

Dozvolite mi da vam ispričam priču.

Devedesetih godina, ako ste željeli poslati fotografiju nekome, morali ste razmišljati o mnogo toga: format datoteke, algoritam kompresije, dubina boja. Svaki softver je imao svoj format. Onda se pojavio JPEG.

Odjednom, nikoga više nije bilo briga za format slike. JPEG je postao infrastruktura. Ne biste rekli "Napravio sam sliku pomoću JPEG-a", samo biste rekli "Poslao sam sliku".

LLM ide istim putem.

Kada tehnologija postane zrak

"LLM je roba. Apple rado kupuje tokene od LLM kompanija, ali Apple je kompanija koja prodaje diferencirane proizvode." — @deuteronormative

Ova rečenica je direktna. Ako ste Apple, nećete sami proizvoditi struju, kupujete je iz električne mreže. Nećete sami proizvoditi gume, kupujete ih od Michelina. Sada, nećete ni sami trenirati LLM, kupujete tokene iz oblaka.

Ovo ne znači da LLM nije važan. Struja je važna. Gume su važne. Ali one su infrastruktura, a ne faktor diferencijacije.

Pobjednik u ratu troškova

Alibaba je upravo objavila Qwen 3.5:

  • 397 milijardi parametara, 17 milijardi aktiviranih
  • 60% jeftiniji od Qwen 3
  • 8 puta brži
  • Cijena tokena je 1/18 cijene Gemini 3 Pro

Ovo nije tehnološki proboj, ovo je rat cijenama. Tako su i LCD televizori pojeftinili. Kompanija koja je prva pala ispod 1000 dolara nije bila tehnološki najbolja, ali je bila pobjednik.

Pragmatični savjeti

Šta ovo znači ako ste programer?

  1. Nemojte sami trenirati modele. Osim ako niste OpenAI, Anthropic ili Alibaba, treniranje modela je bacanje novca. Koristite API.

  2. Fokusirajte se na cijenu, a ne na parametre. 397 milijardi parametara zvuči cool, ali vaše korisnike to ne zanima. Njih zanima brzina odziva i cijena.

  3. Budite spremni za migraciju. LLM je roba, što znači da je zamjenjiv. Danas koristite GPT, sutra Claude, prekosutra Qwen. Vaša arhitektura bi trebala podržavati takvu promjenu.

Zanimljiv paradoks

Oni koji najviše razumiju LLM najmanje pričaju o LLM.

"Andrej Karpathy je napisao mini GPT u 240 linija čistog Pythona. Bez TensorFlowa. Bez PyTorcha. Samo matematika. To pokazuje da LLM nije magija - oni su samo predviđanje sljedećeg tokena."

Kada shvatite da je "predviđanje sljedećeg tokena" sve što ova tehnologija jeste, mnogo pompe nestaje. Ovo nije omalovažavanje. Mikrovalna pećnica samo zagrijava molekule vode, ali je promijenila kuhinju.

Sljedeći korak

LLM će postati nešto poput JPEG-a: sveprisutan, niko ne priča o tome, ali je neophodan.

Do tada, pametni ljudi će izabrati najjeftinijeg dobavljača u ratu cijenama. Jer kada tehnologija postane roba, jedino što je važno je cijena.

Published in Technology

You Might Also Like