Zidul costurilor GPT

În ultima săptămână, discuțiile despre GPT pe X au căpătat un nou punct focal: nu capacitatea, ci costul.

ARC-AGI: Granițele inteligenței

Performanța actuală a celor mai avansate modele pe ARC-AGI-2:

Model	Scor ARC-AGI-2
GPT-5.2 Pro	~54%
GPT-5.2 Refine	~73%
Omul	100%

Diferența dintre 54% și 73% nu este o problemă de inteligență, ci de „rafinare” – de a face modelul să-și verifice răspunsurile în mod repetat. Acest lucru necesită mai multe calcule, ceea ce înseamnă costuri mai mari.

Costul real al agenților

Costul anual al unui Agent de nivel enterprise 24/7 (20 de milioane de tokeni de intrare + 20 de milioane de tokeni de ieșire pe zi):

Model	Cost anual
Palmyra X5	~$48K
GPT-5.2 Standard	~$57K
Gemini 2.5 Pro	~$82K
Claude Sonnet 4.5	~$131K
Claude Opus 4.6	~$219K
GPT-5.2 Pro	~$690K

GPT-5.2 Pro este de 12 ori mai scump decât GPT-5.2 Standard. Aceasta nu este o problemă de strategie de prețuri, ci o problemă de structură a costurilor.

"Înainte de a implementa 100 de agenți AI, faceți calculele." — @waseem_s

Noul test Turing

O întrebare simplă devine noul test de inteligență:

"Spălătoria auto este la 40 de metri de casa mea. Vreau să-mi spăl mașina. Ar trebui să merg pe jos sau cu mașina?"

Modele care au trecut: GPT-5.2 Thinking, Opus 4.6, Gemini 3 Pro Modele care au eșuat: GPT-5.2 Instant, GPT-4o, Haiku 4.5, Sonnet 4.5

De ce este relevant acest test? Pentru că testează „raționamentul de bun simț”, nu „recuperarea de cunoștințe”. 40 de metri este o distanță de mers pe jos. Mașina este murdară și trebuie spălată. Dar nu vei conduce o mașină murdară 40 de metri pentru a o spăla – decât dacă nu ai bun simț.

Istoria nu se repetă, dar rimează

"Sistemele expert s-au născut în anii 1970, au înflorit în anii 1980 și au fost considerate pe scară largă viitorul AI." — @ChombaBupe

Modelele GPT s-au născut în 2018, au înflorit în anii 2020 și sunt considerate pe scară largă viitorul AI.

Eșecul sistemelor expert nu s-a datorat faptului că nu erau suficient de inteligente, ci pentru că costurile de întreținere erau prea mari și scalabilitatea prea slabă. Când baza de cunoștințe trebuie întreținută manual, scara este inamicul.

GPT se confruntă cu o problemă similară: modelul este inteligent, dar costul raționamentului este prea mare. Când fiecare solicitare necesită o cantitate mare de calcul, scara este, de asemenea, inamicul.

Următorii pași

Se așteaptă ca mai multe modele noi să fie lansate în această săptămână: Gemini 3.1 Pro, Claude Sonnet 5, GPT-5.3, DeepSeek V4, Qwen 3.5.

Concurența se mută de la „cine este mai inteligent” la „cine este mai ieftin”. Aceasta este o veste bună pentru utilizatori. Pentru OpenAI? Nu neapărat.

Zidul costurilor GPT

ARC-AGI: Granițele inteligenței

Costul real al agenților

Noul test Turing

Istoria nu se repetă, dar rimează

Următorii pași

You Might Also Like

Claude Code Buddy Modificare Ghid: Cum să obții un animal de companie legendar strălucitor

Obsidian a lansat Defuddle, ducând Obsidian Web Clipper la un nou nivel

OpenAI a anunțat brusc "3 în 1": combinarea browser-ului + programare + ChatGPT, recunoscând că a greșit în ultimul an

2026, nu te mai forța să fii "disciplinat"! Fă aceste 8 lucruri mici și sănătatea va veni natural

Mamele care se străduiesc să slăbească, dar nu reușesc, cu siguranță au căzut aici

AI Browser 24小时稳定运行指南