A GPT költségfal

Az elmúlt héten az X-en a GPT-vel kapcsolatos viták új fókuszpontot kaptak: nem a képességeket, hanem a költségeket.

ARC-AGI: Az intelligencia határa

A legfejlettebb modellek teljesítménye az ARC-AGI-2-n:

Modell	ARC-AGI-2 pontszám
GPT-5.2 Pro	~54%
GPT-5.2 Refine	~73%
Ember	100%

Az 54% és 73% közötti különbség nem intelligencia kérdése, hanem a "finomítás" – az, hogy a modell többször ellenőrzi a saját válaszait. Ez több számítást igényel, ami magasabb költségeket jelent.

Az Agentek valós költsége

A 24/7 vállalati szintű Agentek (napi 20 millió bemeneti + 20 millió kimeneti token) éves költsége:

Modell	Éves költség
Palmyra X5	~$48K
GPT-5.2 Standard	~$57K
Gemini 2.5 Pro	~$82K
Claude Sonnet 4.5	~$131K
Claude Opus 4.6	~$219K
GPT-5.2 Pro	~$690K

A GPT-5.2 Pro 12-szer drágább, mint a GPT-5.2 Standard. Ez nem árképzési stratégia kérdése, hanem költségstruktúra kérdése.

"Mielőtt 100 AI agentet telepítene, számolja ki." — @waseem_s

Az új Turing-teszt

Egy egyszerű kérdés válik az új intelligencia tesztté:

"Az autómosó 40 méterre van a házamtól. Autóval vagy gyalog menjek oda?"

Átment modellek: GPT-5.2 Thinking, Opus 4.6, Gemini 3 Pro Megbukott modellek: GPT-5.2 Instant, GPT-4o, Haiku 4.5, Sonnet 4.5

Miert van ennek a tesztnek értelme? Mert a "józan ész érvelést" teszteli, nem a "tudás visszakeresést". 40 méter gyalog távolság. Az autó piszkos, meg kell mosni. De nem fogod a piszkos autót 40 métert vezetni, hogy megmosd – hacsak nincs józan eszed.

A történelem nem ismétli önmagát, de rímel

"A szakértői rendszerek az 1970-es években születtek, az 1980-as években virágoztak, és széles körben az AI jövőjének tekintették őket." — @ChombaBupe

A GPT modellek 2018-ban születtek, a 2020-as években virágoznak, és széles körben az AI jövőjének tekintik őket.

A szakértői rendszerek kudarca nem azért volt, mert nem voltak elég okosak, hanem mert a karbantartási költségeik túl magasak voltak, és a skálázhatóságuk túl gyenge. Amikor a tudásbázist manuálisan kell karbantartani, a méret az ellenség.

A GPT tükörkérdéssel néz szembe: a modellek okosak, de az érvelés költsége túl magas. Amikor minden kéréshez sok számításra van szükség, a méret szintén az ellenség.

Következő lépések

A héten várhatóan több új modell is megjelenik: Gemini 3.1 Pro, Claude Sonnet 5, GPT-5.3, DeepSeek V4, Qwen 3.5.

A verseny a "ki okosabb" helyett a "ki olcsóbb" felé tolódik el. Ez jó hír a felhasználók számára. Az OpenAI számára? Nem feltétlenül.

A GPT költségfal

ARC-AGI: Az intelligencia határa

Az Agentek valós költsége

Az új Turing-teszt

A történelem nem ismétli önmagát, de rímel

Következő lépések

You Might Also Like

Claude Code Buddy módosítási útmutató: Hogyan szerezd meg a fénylő legendás szörnyet

Obsidian bemutatta a Defuddle-t, amely új magasságokba emeli az Obsidian Web Clipper-t

OpenAI hirtelen bejelentette a "három az egyben"-t: böngésző + programozás + ChatGPT egyesítése, a belső körök elismerik, hogy az elmúlt évben rossz irányba haladtak

2026, ne kényszerítsd magad a 'fegyelemre'! Csináld meg ezt a 8 apróságot, és a egészség magától jön

Azok a mamák, akik keményen próbálnak fogyni, de nem sikerül, biztosan itt buktak el

AI Browser 24 órás stabil működési útmutató