LLM és el proper JPEG
Deixa'm explicar una història.
A la dècada de 1990, si volies enviar una foto a algú, havies de tenir en compte moltes coses: el format del fitxer, l'algorisme de compressió, la profunditat del color. Cada programari tenia el seu propi format. Llavors va aparèixer JPEG.
De sobte, a ningú li importava el format de la imatge. JPEG es va convertir en infraestructura. No diries "He fet una imatge amb JPEG", només diries "He enviat una imatge".
LLM està seguint el mateix camí.
Quan la tecnologia es converteix en aire
"LLM és una mercaderia. Apple està encantada de comprar tokens a les empreses de LLM, però Apple és una empresa que ven productes diferenciats." — @deuteronormative
Aquesta frase ho diu clar. Si ets Apple, no generes la teva pròpia electricitat, compres electricitat de la xarxa. No fas els teus propis pneumàtics, compres pneumàtics de Michelin. Ara, tampoc entrenaràs el teu propi LLM, compres tokens del núvol.
Això no vol dir que LLM no sigui important. L'electricitat és important. Els pneumàtics són importants. Però són infraestructura, no factors de diferenciació.
El guanyador de la guerra de costos
Qwen 3.5, publicat recentment per Alibaba:
- 397.000 milions de paràmetres, 17.000 milions d'activacions
- 60% més barat que Qwen 3
- 8 vegades més ràpid
- El preu del token és 1/18 del de Gemini 3 Pro
Això no és un avenç tecnològic, és una guerra de preus. Així és com van baixar els preus dels televisors LCD en el seu moment. La primera empresa que va baixar per sota dels 1000 dòlars no era la que tenia la millor tecnologia, però va ser la guanyadora.
Consells pragmàtics
Què significa això si ets desenvolupador?
-
No entrenis el teu propi model. A menys que siguis OpenAI, Anthropic o Alibaba, entrenar un model és llençar diners. Utilitza una API.
-
Centra't en el preu en lloc dels paràmetres. 397.000 milions de paràmetres sona genial, però als teus usuaris no els importa. El que els importa és la velocitat de resposta i el cost.
-
Prepara't per migrar. LLM és una mercaderia, el que significa que és reemplaçable. Avui utilitzes GPT, demà utilitzes Claude, demà passat utilitzes Qwen. La teva arquitectura hauria de suportar aquest canvi.
Una paradoxa interessant
Les persones que més saben de LLM són les que menys parlen de LLM.
"Andrej Karpathy va escriure un mini GPT amb 240 línies de Python pur. Sense TensorFlow. Sense PyTorch. Només matemàtiques. Això demostra que LLM no és màgia; només són la predicció del proper token."
Quan entens que la "predicció del proper token" és tot el que és aquesta tecnologia, gran part de la propaganda desapareix. Això no és menysprear. Un microones només escalfa molècules d'aigua, però ha canviat la cuina.
El següent pas
LLM es convertirà en alguna cosa com JPEG: omnipresent, ningú en parla, però indispensable.
Fins llavors, la gent intel·ligent triarà el proveïdor més barat en la guerra de preus. Perquè quan la tecnologia es converteix en una mercaderia, l'únic que importa és el cost.





