Nákladová bariéra GPT
Za posledný týždeň sa v diskusiách o GPT na X objavil nový stredobod: nie schopnosti, ale náklady.
ARC-AGI: Hranice inteligencie
Výkon aktuálne najpokročilejších modelov na ARC-AGI-2:
| Model | ARC-AGI-2 skóre |
|---|---|
| GPT-5.2 Pro | ~54% |
| GPT-5.2 Refine | ~73% |
| Ľudský | 100% |
Rozdiel medzi 54% a 73% nie je problém inteligencie, ale „vylepšenia“ – prinútiť model, aby opakovane kontroloval svoje odpovede. To si vyžaduje viac výpočtov, čo znamená vyššie náklady.
Skutočné náklady na Agenta
Ročné náklady na podnikového Agenta 24/7 (20 miliónov vstupných + 20 miliónov výstupných tokenov denne):
| Model | Ročné náklady |
|---|---|
| Palmyra X5 | ~$48K |
| GPT-5.2 Standard | ~$57K |
| Gemini 2.5 Pro | ~$82K |
| Claude Sonnet 4.5 | ~$131K |
| Claude Opus 4.6 | ~$219K |
| GPT-5.2 Pro | ~$690K |
GPT-5.2 Pro je 12-krát drahší ako GPT-5.2 Standard. Toto nie je problém cenovej stratégie, ale problém nákladovej štruktúry.
"Skôr ako nasadíte 100 AI agentov, spočítajte si to." — @waseem_s
Nový Turingov test
Jednoduchá otázka sa stáva novým testom inteligencie:
"Umývačka áut je od môjho domu vzdialená 40 metrov. Chcem si umyť auto. Mám ísť pešo alebo autom?"
Prešli modely: GPT-5.2 Thinking, Opus 4.6, Gemini 3 Pro Neprešli modely: GPT-5.2 Instant, GPT-4o, Haiku 4.5, Sonnet 4.5
Prečo má tento test zmysel? Pretože testuje „zdravý rozum“ a nie „vyhľadávanie znalostí“. 40 metrov je vzdialenosť na prechádzku. Auto je špinavé a treba ho umyť. Ale nebudete jazdiť so špinavým autom 40 metrov, aby ste ho umyli – pokiaľ nemáte zdravý rozum.
História sa neopakuje, ale sa rýmuje
"Expertové systémy sa zrodili v 70. rokoch, prosperovali v 80. rokoch a boli všeobecne považované za budúcnosť AI." — @ChombaBupe
GPT modely sa zrodili v roku 2018, prosperovali v 20. rokoch 21. storočia a sú všeobecne považované za budúcnosť AI.
Zlyhanie expertných systémov nebolo spôsobené tým, že neboli dostatočne inteligentné, ale tým, že náklady na údržbu boli príliš vysoké a škálovateľnosť príliš nízka. Keď si znalostná báza vyžaduje manuálnu údržbu, rozsah je nepriateľ.
GPT čelí zrkadlovému problému: model je inteligentný, ale náklady na odvodzovanie sú príliš vysoké. Keď si každá požiadavka vyžaduje rozsiahle výpočty, rozsah je tiež nepriateľ.
Ďalšie kroky
Tento týždeň sa očakáva vydanie viacerých nových modelov: Gemini 3.1 Pro, Claude Sonnet 5, GPT-5.3, DeepSeek V4, Qwen 3.5.
Konkurencia sa presúva od „kto je inteligentnejší“ ku „kto je lacnejší“. To je pre používateľov dobrá správa. Pre OpenAI? Nie nevyhnutne.





