GPT-ov troškovni zid

2/17/2026
3 min read

Prošle sedmice, na X-u se pojavio novi fokus u vezi sa raspravama o GPT-u: ne sposobnost, već trošak.

ARC-AGI: Granice inteligencije

Trenutni modeli koji su najnapredniji u ARC-AGI-2 testu:

ModelARC-AGI-2 rezultat
GPT-5.2 Pro~54%
GPT-5.2 Refine~73%
Ljudi100%

Razlika između 54% i 73% nije pitanje inteligencije, već "pročišćavanja" - omogućavanja modelu da više puta provjerava svoje odgovore. To zahtijeva više računanja, što znači veće troškove.

Stvarni troškovi Agenta

Godišnji troškovi za 24/7 Enterprise Agent (20 miliona ulaznih + 20 miliona izlaznih tokena dnevno):

ModelGodišnji trošak
Palmyra X5~$48K
GPT-5.2 Standard~$57K
Gemini 2.5 Pro~$82K
Claude Sonnet 4.5~$131K
Claude Opus 4.6~$219K
GPT-5.2 Pro~$690K

GPT-5.2 Pro je 12 puta skuplji od GPT-5.2 Standard. Ovo nije pitanje strategije cijena, već pitanje strukture troškova.

"Prije nego što rasporedite 100 AI agenata, izračunajte." — @waseem_s

Novi Turingov test

Jednostavno pitanje postaje novi test inteligencije:

"Autopraonica je udaljena 40 metara od moje kuće. Želim oprati auto. Trebam li ići pješice ili voziti auto?"

Modeli koji su prošli: GPT-5.2 Thinking, Opus 4.6, Gemini 3 Pro Modeli koji nisu prošli: GPT-5.2 Instant, GPT-4o, Haiku 4.5, Sonnet 4.5

Zašto je ovaj test značajan? Zato što testira "zdravorazumsko zaključivanje", a ne "pronalaženje znanja". 40 metara je udaljenost za hodanje. Auto je prljav i treba ga oprati. Ali nećete voziti prljavi auto 40 metara da ga operete - osim ako nemate zdrav razum.

Historija se ne ponavlja, ali se rimuje

"Ekspertni sistemi su rođeni 1970-ih, procvjetali 1980-ih i bili su naširoko smatrani budućnošću AI." — @ChombaBupe

GPT modeli su rođeni 2018., procvjetali 2020-ih i naširoko se smatraju budućnošću AI.

Neuspjeh ekspertnih sistema nije bio zato što nisu bili dovoljno pametni, već zato što su troškovi održavanja bili previsoki, a skalabilnost preslaba. Kada bazu znanja treba ručno održavati, veličina je neprijatelj.

GPT se suočava sa sličnim problemom: model je pametan, ali je trošak zaključivanja previsok. Kada svaki zahtjev zahtijeva puno računanja, veličina je također neprijatelj.

Sljedeći koraci

Ove sedmice se očekuje nekoliko novih modela: Gemini 3.1 Pro, Claude Sonnet 5, GPT-5.3, DeepSeek V4, Qwen 3.5.

Konkurencija se prebacuje sa "ko je pametniji" na "ko je jeftiniji". Ovo je dobra vijest za korisnike. Za OpenAI? Možda i ne.

Published in Technology

You Might Also Like