LLM е следващият JPEG
Нека ви разкажа една история.
През 90-те години, ако искахте да изпратите снимка на някого, трябваше да обмислите много неща: файлов формат, алгоритъм за компресиране, дълбочина на цветовете. Всеки софтуер имаше свой собствен формат. След това се появи JPEG.
Изведнъж никой вече не се интересуваше от формата на изображението. JPEG стана инфраструктура. Няма да кажете „Направих снимка с JPEG“, просто казвате „Изпратих снимка“.
LLM върви по същия път.
Когато технологията стане въздух
"LLM са стока. Apple с удоволствие купува токени от LLM компании, но Apple е компания, която продава диференцирани продукти." — @deuteronormative
Това е казано направо. Ако сте Apple, няма да генерирате собствена електроенергия, купувате електроенергия от електрическата мрежа. Няма да произвеждате собствени гуми, купувате гуми от Michelin. Сега няма да тренирате сами LLM, купувате токени от облака.
Това не означава, че LLM не са важни. Електричеството е важно. Гумите са важни. Но те са инфраструктура, а не диференциращ фактор.
Победителят във войната на разходите
Qwen 3.5, току-що пуснат от Alibaba:
- 397 милиарда параметри, 17 милиарда активирани
- 60% по-евтин от Qwen 3
- 8 пъти по-бърз
- Цената на токен е 1/18 от Gemini 3 Pro
Това не е технологичен пробив, това е ценова война. LCD телевизорите също поевтиняха по този начин. Първата компания, която падна под 1000 долара, не беше тази с най-добрата технология, но беше победител.
Прагматични съвети
Какво означава това, ако сте разработчик?
-
Не тренирайте сами модели. Освен ако не сте OpenAI, Anthropic или Alibaba, обучението на модели е изгаряне на пари. Използвайте API.
-
Съсредоточете се върху цената, а не върху параметрите. 397 милиарда параметри звучат готино, но вашите потребители не се интересуват. Те се интересуват от скоростта на реакция и цената.
-
Пригответе се за миграция. LLM са стока, което означава, че са заменяеми. Днес използвате GPT, утре Claude, вдругиден Qwen. Вашата архитектура трябва да поддържа тази смяна.
Интересен парадокс
Хората, които разбират най-много от LLM, всъщност не говорят много за LLM.
"Andrej Karpathy написа мини GPT с 240 реда чист Python. Без TensorFlow. Без PyTorch. Само математика. Това показва, че LLM не са магия - те са просто прогнозиране на следващия токен."
Когато разберете, че „прогнозирането на следващия токен“ е всичко, което представлява тази технология, много от шумотевицата изчезва. Това не е омаловажаване. Микровълновата печка просто загрява водни молекули, но промени кухнята.
Следваща стъпка
LLM ще се превърнат в нещо като JPEG: навсякъде, никой не говори за тях, но са незаменими.
Дотогава умните хора ще избират най-евтиния доставчик в ценовата война. Защото, когато технологията се превърне в стока, единственото, което има значение, е цената.





