LLM je naslednji JPEG

2/17/2026
3 min read

Naj vam povem zgodbo.

V 90. letih prejšnjega stoletja, če si želel poslati fotografijo nekomu drugemu, si moral razmišljati o marsičem: format datoteke, algoritem stiskanja, barvna globina. Vsaka programska oprema je imela svoj format. Potem se je pojavil JPEG.

Nenadoma nikogar več ni zanimal format slike. JPEG je postal infrastruktura. Ne bi rekel "Naredil sem sliko z JPEG-jem", rekel bi samo "Poslal sem sliko".

LLM gre po isti poti.

Ko tehnologija postane zrak

"LLM je blago. Apple z veseljem kupuje žetone od podjetij LLM, vendar je Apple podjetje, ki prodaja diferencirane izdelke." — @deuteronormative

Ta izjava je jasna. Če ste Apple, ne boste sami proizvajali električne energije, jo boste kupili iz električnega omrežja. Ne boste sami izdelovali pnevmatik, jih boste kupili od Michelina. Zdaj tudi sami ne boste usposabljali LLM, ampak boste kupovali žetone v oblaku.

To ne pomeni, da LLM ni pomemben. Elektrika je pomembna. Pnevmatike so pomembne. Vendar so infrastruktura, ne pa diferenciacijski dejavnik.

Zmagovalec stroškovne vojne

Qwen 3.5, ki ga je pravkar izdal Alibaba:

  • 397 milijard parametrov, 17 milijard aktiviranih
  • 60 % cenejši od Qwen 3
  • 8-krat hitrejši
  • Cena žetona je 1/18 cene Gemini 3 Pro

To ni tehnološki preboj, to je cenovna vojna. Tako so se včasih pocenile LCD televizije. Podjetje, ki je prvo padlo pod 1000 dolarjev, ni bilo tehnološko najboljše, je pa zmagalo.

Pragmatični nasveti

Kaj to pomeni, če ste razvijalec?

  1. Ne usposabljajte modelov sami. Razen če ste OpenAI, Anthropic ali Alibaba, je usposabljanje modelov zapravljanje denarja. Uporabite API.

  2. Osredotočite se na ceno in ne na parametre. 397 milijard parametrov se sliši kul, vendar vaše uporabnike to ne zanima. Zanima jih hitrost odziva in stroški.

  3. Bodite pripravljeni na selitev. LLM je blago, kar pomeni, da ga je mogoče zamenjati. Danes uporabljate GPT, jutri Claude, pojutrišnjem Qwen. Vaša arhitektura bi morala podpirati takšno preklapljanje.

Zanimiv paradoks

Ljudje, ki najbolj razumejo LLM, o njih najmanj govorijo.

"Andrej Karpathy je napisal mini GPT v 240 vrsticah čistega Pythona. Brez TensorFlow. Brez PyTorch. Samo matematika. To kaže, da LLM ni čarovnija – so samo napovedovalci naslednjega žetona."

Ko razumete, da je "napovedovanje naslednjega žetona" vse, kar ta tehnologija je, izgine veliko pompa. To ni omalovaževanje. Mikrovalovna pečica samo segreva molekule vode, vendar je spremenila kuhinjo.

Naslednji korak

LLM bo postal nekaj takega kot JPEG: vseprisoten, o njem nihče ne bo razpravljal, vendar nepogrešljiv.

Do takrat bodo pametni ljudje v cenovni vojni izbrali najcenejšega ponudnika. Ker ko tehnologija postane blago, je edino, kar je pomembno, strošek.

Published in Technology

You Might Also Like