LLM on seuraava JPEG
Saan kertoa tarinan.
1990-luvulla, jos halusit lähettää valokuvan jollekin, sinun piti miettiä monia asioita: tiedostomuotoa, pakkausalgoritmia, värisyvyyttä. Jokaisella ohjelmistolla oli oma muotonsa. Sitten tuli JPEG.
Yhtäkkiä kukaan ei enää välittänyt kuvamuodoista. JPEGistä tuli infrastruktuuri. Et sanoisi "Tein kuvan JPEGillä", sanoisit vain "Lähetin kuvan".
LLM on menossa samaan suuntaan.
Kun teknologiasta tulee ilmaa
"LLM:t ovat hyödykkeitä. Apple ostaa mielellään tokeneita LLM-yrityksiltä, mutta Apple on yritys, joka myy erilaistettuja tuotteita." — @deuteronormative
Tämä on suoraan sanottu. Jos olet Apple, et tuota sähköä itse, vaan ostat sähköä sähköverkosta. Et valmista renkaita itse, vaan ostat renkaita Micheliniltä. Nyt et myöskään kouluta LLM:ää itse, vaan ostat tokeneita pilvestä.
Tämä ei tarkoita, että LLM:t eivät olisi tärkeitä. Sähkö on tärkeää. Renkaat ovat tärkeitä. Mutta ne ovat infrastruktuuria, eivät erottavia tekijöitä.
Kustannussodan voittaja
Alibaban juuri julkaisema Qwen 3.5:
- 397 miljardia parametria, 17 miljardia aktivoituna
- 60 % halvempi kuin Qwen 3
- 8 kertaa nopeampi
- Tokenien hinta on 1/18 Gemini 3 Pron hinnasta
Tämä ei ole teknologinen läpimurto, vaan hintasota. Nestekidenäytöt laskivat hintojaan samalla tavalla. Ensimmäinen alle 1000 dollarin rajan rikkonut yritys ei ollut teknisesti paras, mutta se oli voittaja.
Käytännöllisiä neuvoja
Mitä tämä tarkoittaa, jos olet kehittäjä?
-
Älä kouluta malleja itse. Ellei olet OpenAI, Anthropic tai Alibaba, mallien kouluttaminen on rahan tuhlausta. Käytä API:a.
-
Keskity hintaan parametrien sijaan. 397 miljardia parametria kuulostaa hienolta, mutta käyttäjäsi eivät välitä. He välittävät vasteajasta ja kustannuksista.
-
Valmistaudu siirtymään. LLM on hyödyke, mikä tarkoittaa, että se on vaihdettavissa. Tänään käytät GPT:tä, huomenna Claudea ja ylihuomenna Qweniä. Arkkitehtuurisi pitäisi tukea tällaista vaihtoa.
Mielenkiintoinen paradoksi
Ne, jotka ymmärtävät LLM:iä parhaiten, puhuvat niistä vähiten.
"Andrej Karpathy kirjoitti mini-GPT:n 240 rivillä puhdasta Pythonia. Ei TensorFlow:ta. Ei PyTorch:ia. Vain matematiikkaa. Se osoittaa, että LLM:t eivät ole taikuutta – ne ovat vain seuraavan tokenin ennustamista."
Kun ymmärrät, että "seuraavan tokenin ennustaminen" on kaikki mitä tämä tekniikka on, suuri osa hypestä katoaa. Tämä ei ole vähättelyä. Mikroaaltouuni lämmittää vain vesimolekyylejä, mutta se muutti keittiön.
Seuraava askel
LLM:stä tulee jotain JPEGin kaltaista: kaikkialla läsnä oleva, josta kukaan ei puhu, mutta joka on välttämätön.
Sitä ennen älykkäät ihmiset valitsevat halvimman toimittajan hintasodassa. Koska kun tekniikka on hyödykkeistetty, ainoa asia, jolla on merkitystä, on kustannukset.





