GPT izmaksu siena

Pēdējā nedēļā X platformā diskusijas par GPT ir pievērsušās jaunam fokusam: nevis spējām, bet gan izmaksām.

ARC-AGI: Intelekta robežas

Pašlaik vismodernāko modeļu sniegums ARC-AGI-2:

Modelis	ARC-AGI-2 rezultāts
GPT-5.2 Pro	~54%
GPT-5.2 Refine	~73%
Cilvēks	100%

Starpība starp 54% un 73% nav intelekta jautājums, bet gan "precizēšana" – ļaujot modelim atkārtoti pārbaudīt savas atbildes. Tas prasa vairāk aprēķinu, kas nozīmē lielākas izmaksas.

Aģenta patiesās izmaksas

24/7 uzņēmuma līmeņa aģenta (20 miljoni ievades + 20 miljoni izvades tokenu dienā) gada izmaksas:

Modelis	Gada izmaksas
Palmyra X5	~$48K
GPT-5.2 Standard	~$57K
Gemini 2.5 Pro	~$82K
Claude Sonnet 4.5	~$131K
Claude Opus 4.6	~$219K
GPT-5.2 Pro	~$690K

GPT-5.2 Pro ir 12 reizes dārgāks nekā GPT-5.2 Standard. Tas nav cenu stratēģijas jautājums, bet gan izmaksu struktūras jautājums.

"Pirms izvietojat 100 AI aģentus, veiciet aprēķinus." — @waseem_s

Jauns Tjūringa tests

Viens vienkāršs jautājums kļūst par jaunu intelekta testu:

"Automašīnu mazgātava atrodas 40 metru attālumā no manām mājām. Es vēlos nomazgāt savu automašīnu. Vai man vajadzētu iet kājām vai braukt ar automašīnu?"

Modeļi, kas izturēja testu: GPT-5.2 Thinking, Opus 4.6, Gemini 3 Pro Modeļi, kas neizturēja testu: GPT-5.2 Instant, GPT-4o, Haiku 4.5, Sonnet 4.5

Kāpēc šis tests ir nozīmīgs? Jo tas testē "veselo saprātu", nevis "zināšanu izgūšanu". 40 metri ir gājiena attālums. Automašīna ir netīra un jāmazgā. Bet jūs nebrauksiet ar netīru automašīnu 40 metrus, lai to nomazgātu – ja vien jums nav veselā saprāta.

Vēsture neatkārtojas, bet atskaņojas

"Ekspertu sistēmas dzima 1970. gados, uzplauka 1980. gados un tika plaši uzskatītas par AI nākotni." — @ChombaBupe

GPT modeļi dzima 2018. gadā, uzplauka 2020. gados un tiek plaši uzskatīti par AI nākotni.

Ekspertu sistēmu neveiksme nebija saistīta ar to, ka tās nebija pietiekami gudras, bet gan ar to, ka uzturēšanas izmaksas bija pārāk augstas un mērogojamība bija pārāk slikta. Kad zināšanu bāze ir jāuztur manuāli, apjoms ir ienaidnieks.

GPT saskaras ar spoguļproblēmu: modelis ir gudrs, bet spriešanas izmaksas ir pārāk augstas. Kad katrs pieprasījums prasa lielu aprēķinu apjomu, apjoms arī ir ienaidnieks.

Nākamie soļi

Šonedēļ paredzams, ka tiks izlaisti vairāki jauni modeļi: Gemini 3.1 Pro, Claude Sonnet 5, GPT-5.3, DeepSeek V4, Qwen 3.5.

Konkurence pāriet no "kurš ir gudrāks" uz "kurš ir lētāks". Tas ir labas ziņas lietotājiem. OpenAI? Varbūt nē.

GPT izmaksu siena

ARC-AGI: Intelekta robežas

Aģenta patiesās izmaksas

Jauns Tjūringa tests

Vēsture neatkārtojas, bet atskaņojas

Nākamie soļi

You Might Also Like

Claude Code Buddy modificēšanas ceļvedis: kā iegūt spīdīgu leģendāro mājdzīvnieku

Obsidian ir izlaidusi Defuddle, pacelot Obsidian Web Clipper uz jauniem augstumiem

OpenAI pēkšņi paziņo par "trīs vienā": pārlūks + programmēšana + ChatGPT apvienošana, iekšēji atzīst, ka pagājušajā gadā tika pieļautas kļūdas

2026, vairs neuzspied sevi "pašdisciplīnai"! Veic šos 8 sīkumus, veselība nāks dabiski

Māmiņas, kas cenšas zaudēt svaru, bet nesasniedz rezultātus, noteikti ir šeit

AI Pārlūka 24 stundu stabilas darbības ceļvedis