A GPT költségfal
Az elmúlt héten az X-en a GPT-vel kapcsolatos viták új fókuszpontot kaptak: nem a képességeket, hanem a költségeket.
ARC-AGI: Az intelligencia határa
A legfejlettebb modellek teljesítménye az ARC-AGI-2-n:
| Modell | ARC-AGI-2 pontszám |
|---|---|
| GPT-5.2 Pro | ~54% |
| GPT-5.2 Refine | ~73% |
| Ember | 100% |
Az 54% és 73% közötti különbség nem intelligencia kérdése, hanem a "finomítás" – az, hogy a modell többször ellenőrzi a saját válaszait. Ez több számítást igényel, ami magasabb költségeket jelent.
Az Agentek valós költsége
A 24/7 vállalati szintű Agentek (napi 20 millió bemeneti + 20 millió kimeneti token) éves költsége:
| Modell | Éves költség |
|---|---|
| Palmyra X5 | ~$48K |
| GPT-5.2 Standard | ~$57K |
| Gemini 2.5 Pro | ~$82K |
| Claude Sonnet 4.5 | ~$131K |
| Claude Opus 4.6 | ~$219K |
| GPT-5.2 Pro | ~$690K |
A GPT-5.2 Pro 12-szer drágább, mint a GPT-5.2 Standard. Ez nem árképzési stratégia kérdése, hanem költségstruktúra kérdése.
"Mielőtt 100 AI agentet telepítene, számolja ki." — @waseem_s
Az új Turing-teszt
Egy egyszerű kérdés válik az új intelligencia tesztté:
"Az autómosó 40 méterre van a házamtól. Autóval vagy gyalog menjek oda?"
Átment modellek: GPT-5.2 Thinking, Opus 4.6, Gemini 3 Pro Megbukott modellek: GPT-5.2 Instant, GPT-4o, Haiku 4.5, Sonnet 4.5
Miert van ennek a tesztnek értelme? Mert a "józan ész érvelést" teszteli, nem a "tudás visszakeresést". 40 méter gyalog távolság. Az autó piszkos, meg kell mosni. De nem fogod a piszkos autót 40 métert vezetni, hogy megmosd – hacsak nincs józan eszed.
A történelem nem ismétli önmagát, de rímel
"A szakértői rendszerek az 1970-es években születtek, az 1980-as években virágoztak, és széles körben az AI jövőjének tekintették őket." — @ChombaBupe
A GPT modellek 2018-ban születtek, a 2020-as években virágoznak, és széles körben az AI jövőjének tekintik őket.
A szakértői rendszerek kudarca nem azért volt, mert nem voltak elég okosak, hanem mert a karbantartási költségeik túl magasak voltak, és a skálázhatóságuk túl gyenge. Amikor a tudásbázist manuálisan kell karbantartani, a méret az ellenség.
A GPT tükörkérdéssel néz szembe: a modellek okosak, de az érvelés költsége túl magas. Amikor minden kéréshez sok számításra van szükség, a méret szintén az ellenség.
Következő lépések
A héten várhatóan több új modell is megjelenik: Gemini 3.1 Pro, Claude Sonnet 5, GPT-5.3, DeepSeek V4, Qwen 3.5.
A verseny a "ki okosabb" helyett a "ki olcsóbb" felé tolódik el. Ez jó hír a felhasználók számára. Az OpenAI számára? Nem feltétlenül.





