GPT-ov zid troškova

Prošle nedelje, diskusija o GPT-u na X-u dobila je novi fokus: ne sposobnost, već troškovi.

ARC-AGI: Granice inteligencije

Trenutne performanse najnaprednijih modela na ARC-AGI-2:

Model	ARC-AGI-2 rezultat
GPT-5.2 Pro	~54%
GPT-5.2 Refine	~73%
Ljudi	100%

Razlika između 54% i 73% nije pitanje inteligencije, već "preciziranja" – omogućavanja modelu da više puta proveri svoje odgovore. Ovo zahteva više računanja, što znači veće troškove.

Stvarni troškovi Agent-a

Godišnji troškovi 24/7 Agent-a za preduzeća (20 miliona ulaznih + 20 miliona izlaznih tokena dnevno):

Model	Godišnji trošak
Palmyra X5	~$48K
GPT-5.2 Standard	~$57K
Gemini 2.5 Pro	~$82K
Claude Sonnet 4.5	~$131K
Claude Opus 4.6	~$219K
GPT-5.2 Pro	~$690K

GPT-5.2 Pro je 12 puta skuplji od GPT-5.2 Standard. Ovo nije pitanje strategije cena, već strukture troškova.

"Pre nego što rasporedite 100 AI agenata, izračunajte." — @waseem_s

Novi Turingov test

Jednostavno pitanje postaje novi test inteligencije:

"Perionica automobila je udaljena 40 metara od moje kuće. Želim da operem auto. Da li da idem peške ili da se vozim?"

Modeli koji su prošli: GPT-5.2 Thinking, Opus 4.6, Gemini 3 Pro Modeli koji su pali: GPT-5.2 Instant, GPT-4o, Haiku 4.5, Sonnet 4.5

Zašto je ovaj test značajan? Zato što testira "zdravorazumsko rezonovanje", a ne "pronalaženje znanja". 40 metara je udaljenost za pešačenje. Auto je prljav i treba ga oprati. Ali nećete voziti prljav auto 40 metara da biste ga oprali – osim ako nemate zdrav razum.

Istorija se ne ponavlja, ali se rimuje

"Ekspertski sistemi su rođeni 1970-ih, procvetali 1980-ih i bili su naširoko smatrani budućnošću AI." — @ChombaBupe

GPT modeli su rođeni 2018. godine, procvetali 2020-ih i naširoko se smatraju budućnošću AI.

Neuspeh ekspertskih sistema nije bio zato što nisu bili dovoljno pametni, već zato što su troškovi održavanja bili previsoki, a skalabilnost preniska. Kada je bazu znanja potrebno ručno održavati, veličina je neprijatelj.

GPT se suočava sa sličnim problemom: model je pametan, ali su troškovi rezonovanja previsoki. Kada svaki zahtev zahteva veliku količinu računanja, veličina je takođe neprijatelj.

Sledeći koraci

Ove nedelje se očekuje izdavanje nekoliko novih modela: Gemini 3.1 Pro, Claude Sonnet 5, GPT-5.3, DeepSeek V4, Qwen 3.5.

Konkurencija se prebacuje sa "ko je pametniji" na "ko je jeftiniji". Ovo je dobra vest za korisnike. Za OpenAI? Možda i ne.

GPT-ov zid troškova

ARC-AGI: Granice inteligencije

Stvarni troškovi Agent-a

Novi Turingov test

Istorija se ne ponavlja, ali se rimuje

Sledeći koraci

You Might Also Like

Claude Code Buddy модификација: Како добити сјајног легендарног љубимца

Obsidian je lansirao Defuddle, podigao Obsidian Web Clipper na novi nivo

OpenAI iznenada najavljuje "tri u jednom": spajanje pretraživača + programiranja + ChatGPT, unutrašnje priznanje da su prošle godine pogrešili

2026, ne prisiljavajte se na "disciplinu"! Uradite ovih 8 malih stvari, zdravlje će doći prirodno

One of the reasons why mothers who work hard to lose weight can't succeed is definitely here

AI Browser 24-сатна стабилна операција