LLM ir nākamais JPEG
Ļaujiet man pastāstīt stāstu.
- gados, ja vēlējāties nosūtīt fotoattēlu kādam citam, jums bija jāapsver daudz: faila formāts, saspiešanas algoritms, krāsu dziļums. Katrai programmatūrai bija savs formāts. Tad parādījās JPEG.
Pēkšņi neviens vairs neuztraucās par attēlu formātiem. JPEG kļuva par infrastruktūru. Jūs nesakāt "Es izveidoju attēlu, izmantojot JPEG", jūs vienkārši sakāt "Es nosūtīju attēlu".
LLM iet to pašu ceļu.
Kad tehnoloģija kļūst par gaisu
"LLM ir prece. Apple labprāt iegādājas tokenus no LLM uzņēmumiem, bet Apple ir uzņēmums, kas pārdod diferencētus produktus." — @deuteronormative
Šis teikums ir pateikts tieši. Ja jūs būtu Apple, jūs neražotu elektrību pats, jūs iegādātos elektrību no elektrotīkla. Jūs neražotu riepas pats, jūs iegādātos riepas no Michelin. Tagad jūs arī netrenētu LLM pats, jūs iegādātos tokenus no mākoņa.
Tas nenozīmē, ka LLM nav svarīgi. Elektrība ir svarīga. Riepas ir svarīgas. Bet tās ir infrastruktūra, nevis diferencējošs faktors.
Izmaksu kara uzvarētājs
Alibaba tikko izlaida Qwen 3.5:
- 397 miljardi parametru, 17 miljardi aktivizāciju
- Par 60% lētāks nekā Qwen 3
- 8 reizes ātrāks
- Tokenu cena ir 1/18 no Gemini 3 Pro cenas
Tas nav tehnoloģisks izrāviens, tas ir cenu karš. LCD televizori savulaik arī šādi samazināja cenas. Pirmais uzņēmums, kas nokrita zem 1000 ASV dolāriem, nebija tehnoloģiski labākais, bet tas bija uzvarētājs.
Praktiski ieteikumi
Ko tas nozīmē, ja esat izstrādātājs?
-
Netrenējiet modeļus pats. Ja vien neesat OpenAI, Anthropic vai Alibaba, modeļu apmācība ir naudas izšķiešana. Izmantojiet API.
-
Koncentrējieties uz cenu, nevis parametriem. 397 miljardi parametru izklausās forši, bet jūsu lietotājiem tas neinteresē. Viņus interesē reakcijas ātrums un izmaksas.
-
Esiet gatavi migrācijai. LLM ir prece, kas nozīmē, ka to var aizstāt. Šodien izmantojiet GPT, rīt izmantojiet Claude, parīt izmantojiet Qwen. Jūsu arhitektūrai jāatbalsta šāda pārslēgšanās.
Interesants paradokss
Tie, kas vislabāk pārzina LLM, vismazāk runā par LLM.
"Andrej Karpathy uzrakstīja mini GPT ar 240 rindiņām tīra Python koda. Bez TensorFlow. Bez PyTorch. Tikai matemātika. Tas parāda, ka LLM nav maģija — tie ir tikai nākamā tokena paredzēšana."
Kad saprotat, ka "nākamā tokena paredzēšana" ir visa šīs tehnoloģijas būtība, daudzi reklāmas triki pazūd. Tas nav noniecinājums. Mikroviļņu krāsns tikai silda ūdens molekulas, bet tā maina virtuvi.
Nākamais solis
LLM kļūs par kaut ko līdzīgu JPEG: visur esošu, neviens par to nerunā, bet neaizstājamu.
Līdz tam gudri cilvēki cenu karā izvēlēsies lētāko piegādātāju. Jo, kad tehnoloģija kļūst par preci, vienīgais, kas ir svarīgs, ir izmaksas.





