LLM yra kitas JPEG
Leiskite papasakoti istoriją.
1990-aisiais, jei norėjote nusiųsti nuotrauką kam nors, turėjote apgalvoti daug dalykų: failo formatą, glaudinimo algoritmą, spalvų gylį. Kiekviena programinė įranga turėjo savo formatą. Tada atsirado JPEG.
Staiga niekam neberūpėjo nuotraukų formatai. JPEG tapo infrastruktūra. Jūs nesakote „Aš padariau nuotrauką su JPEG“, jūs tiesiog sakote „Aš nusiunčiau nuotrauką“.
LLM eina tuo pačiu keliu.
Kai technologija tampa oru
„LLM yra prekė. „Apple“ mielai perka žetonus iš LLM įmonių, tačiau „Apple“ yra įmonė, parduodanti diferencijuotus produktus.“ – @deuteronormative
Šis sakinys pasako viską. Jei esate „Apple“, jūs negaminate elektros patys, jūs perkate ją iš elektros tinklo. Jūs negaminate padangų patys, jūs perkate jas iš „Michelin“. Dabar jūs taip pat netreniruosite LLM patys, jūs perkate žetonus iš debesies.
Tai nereiškia, kad LLM nėra svarbūs. Elektra yra svarbi. Padangos yra svarbios. Tačiau jos yra infrastruktūra, o ne diferenciacinis veiksnys.
Kainų karo nugalėtojas
„Alibaba“ ką tik išleido Qwen 3.5:
- 397 milijardai parametrų, 17 milijardų aktyvuotų
- 60% pigesnis nei Qwen 3
- 8 kartus greitesnis
- Token kaina yra 1/18 Gemini 3 Pro kainos
Tai nėra technologinis proveržis, tai yra kainų karas. Taip pat kadaise atpigo LCD televizoriai. Pirmoji įmonė, kuri nukrito žemiau 1000 USD, nebuvo technologiškai geriausia, bet ji yra nugalėtoja.
Praktiniai patarimai
Ką tai reiškia jums, kūrėjams?
-
Netreniruokite modelių patys. Nebent esate OpenAI, Anthropic arba Alibaba, modelių treniravimas yra pinigų švaistymas. Naudokite API.
-
Dėmesį kreipkite į kainą, o ne į parametrus. 397 milijardai parametrų skamba šauniai, bet jūsų vartotojams tai nerūpi. Jiems rūpi atsako greitis ir kaina.
-
Būkite pasiruošę migracijai. LLM yra prekė, o tai reiškia, kad ją galima pakeisti. Šiandien naudojate GPT, rytoj Claude, poryt Qwen. Jūsų architektūra turėtų palaikyti tokį perjungimą.
Įdomus paradoksas
Žmonės, kurie geriausiai supranta LLM, apie juos kalba mažiausiai.
„Andrej Karpathy parašė mini GPT su 240 eilučių gryno Python kodo. Jokių TensorFlow. Jokių PyTorch. Tik matematika. Tai rodo, kad LLM nėra magija – tai tiesiog kito žetono prognozavimas.“
Kai suprantate, kad „kito žetono prognozavimas“ yra visa šios technologijos esmė, daugelis ažiotažų išnyksta. Tai nėra nuvertinimas. Mikrobangų krosnelė taip pat tik šildo vandens molekules, bet ji pakeitė virtuvę.
Kitas žingsnis
LLM taps kažkuo panašiu į JPEG: visur esantis, niekas nekalba, bet būtinas.
Iki tol protingi žmonės kainų kare pasirinks pigiausią tiekėją. Nes kai technologija tampa preke, vienintelis dalykas, kuris yra svarbus, yra kaina.





