LLM on seuraava JPEG

Saan kertoa tarinan.

1990-luvulla, jos halusit lähettää valokuvan jollekin, sinun piti miettiä monia asioita: tiedostomuotoa, pakkausalgoritmia, värisyvyyttä. Jokaisella ohjelmistolla oli oma muotonsa. Sitten tuli JPEG.

Yhtäkkiä kukaan ei enää välittänyt kuvamuodoista. JPEGistä tuli infrastruktuuri. Et sanoisi "Tein kuvan JPEGillä", sanoisit vain "Lähetin kuvan".

LLM on menossa samaan suuntaan.

Kun teknologiasta tulee ilmaa

"LLM:t ovat hyödykkeitä. Apple ostaa mielellään tokeneita LLM-yrityksiltä, mutta Apple on yritys, joka myy erilaistettuja tuotteita." — @deuteronormative

Tämä on suoraan sanottu. Jos olet Apple, et tuota sähköä itse, vaan ostat sähköä sähköverkosta. Et valmista renkaita itse, vaan ostat renkaita Micheliniltä. Nyt et myöskään kouluta LLM:ää itse, vaan ostat tokeneita pilvestä.

Tämä ei tarkoita, että LLM:t eivät olisi tärkeitä. Sähkö on tärkeää. Renkaat ovat tärkeitä. Mutta ne ovat infrastruktuuria, eivät erottavia tekijöitä.

Kustannussodan voittaja

Alibaban juuri julkaisema Qwen 3.5:

397 miljardia parametria, 17 miljardia aktivoituna
60 % halvempi kuin Qwen 3
8 kertaa nopeampi
Tokenien hinta on 1/18 Gemini 3 Pron hinnasta

Tämä ei ole teknologinen läpimurto, vaan hintasota. Nestekidenäytöt laskivat hintojaan samalla tavalla. Ensimmäinen alle 1000 dollarin rajan rikkonut yritys ei ollut teknisesti paras, mutta se oli voittaja.

Käytännöllisiä neuvoja

Mitä tämä tarkoittaa, jos olet kehittäjä?

Älä kouluta malleja itse. Ellei olet OpenAI, Anthropic tai Alibaba, mallien kouluttaminen on rahan tuhlausta. Käytä API:a.
Keskity hintaan parametrien sijaan. 397 miljardia parametria kuulostaa hienolta, mutta käyttäjäsi eivät välitä. He välittävät vasteajasta ja kustannuksista.
Valmistaudu siirtymään. LLM on hyödyke, mikä tarkoittaa, että se on vaihdettavissa. Tänään käytät GPT:tä, huomenna Claudea ja ylihuomenna Qweniä. Arkkitehtuurisi pitäisi tukea tällaista vaihtoa.

Mielenkiintoinen paradoksi

Ne, jotka ymmärtävät LLM:iä parhaiten, puhuvat niistä vähiten.

"Andrej Karpathy kirjoitti mini-GPT:n 240 rivillä puhdasta Pythonia. Ei TensorFlow:ta. Ei PyTorch:ia. Vain matematiikkaa. Se osoittaa, että LLM:t eivät ole taikuutta – ne ovat vain seuraavan tokenin ennustamista."

Kun ymmärrät, että "seuraavan tokenin ennustaminen" on kaikki mitä tämä tekniikka on, suuri osa hypestä katoaa. Tämä ei ole vähättelyä. Mikroaaltouuni lämmittää vain vesimolekyylejä, mutta se muutti keittiön.

Seuraava askel

LLM:stä tulee jotain JPEGin kaltaista: kaikkialla läsnä oleva, josta kukaan ei puhu, mutta joka on välttämätön.

Sitä ennen älykkäät ihmiset valitsevat halvimman toimittajan hintasodassa. Koska kun tekniikka on hyödykkeistetty, ainoa asia, jolla on merkitystä, on kustannukset.

LLM on seuraava JPEG

Kun teknologiasta tulee ilmaa

Kustannussodan voittaja

Käytännöllisiä neuvoja

Mielenkiintoinen paradoksi

Seuraava askel

You Might Also Like

Claude Code Buddy 修改指南：如何获得闪光传说级宠物

Obsidian julkaisi Defuddlen, joka vie Obsidian Web Clipperin uudelle tasolle

OpenAI yllättäen ilmoittaa "kolme yhdessä": selain + ohjelmointi + ChatGPT yhdistyvät, sisäisesti myönnetään, että viime vuosi meni pieleen

2026, älä pakota itseäsi 'itsekuriksi'! Tee nämä 8 pientä asiaa, terveys tulee luonnostaan

Ne äidit, jotka yrittävät laihtua mutta eivät onnistu, kompastuvat varmasti tähän

AI Browser 24小时稳定运行指南