GPT izmaksu siena
Pēdējā nedēļā X platformā diskusijas par GPT ir pievērsušās jaunam fokusam: nevis spējām, bet gan izmaksām.
ARC-AGI: Intelekta robežas
Pašlaik vismodernāko modeļu sniegums ARC-AGI-2:
| Modelis | ARC-AGI-2 rezultāts |
|---|---|
| GPT-5.2 Pro | ~54% |
| GPT-5.2 Refine | ~73% |
| Cilvēks | 100% |
Starpība starp 54% un 73% nav intelekta jautājums, bet gan "precizēšana" – ļaujot modelim atkārtoti pārbaudīt savas atbildes. Tas prasa vairāk aprēķinu, kas nozīmē lielākas izmaksas.
Aģenta patiesās izmaksas
24/7 uzņēmuma līmeņa aģenta (20 miljoni ievades + 20 miljoni izvades tokenu dienā) gada izmaksas:
| Modelis | Gada izmaksas |
|---|---|
| Palmyra X5 | ~$48K |
| GPT-5.2 Standard | ~$57K |
| Gemini 2.5 Pro | ~$82K |
| Claude Sonnet 4.5 | ~$131K |
| Claude Opus 4.6 | ~$219K |
| GPT-5.2 Pro | ~$690K |
GPT-5.2 Pro ir 12 reizes dārgāks nekā GPT-5.2 Standard. Tas nav cenu stratēģijas jautājums, bet gan izmaksu struktūras jautājums.
"Pirms izvietojat 100 AI aģentus, veiciet aprēķinus." — @waseem_s
Jauns Tjūringa tests
Viens vienkāršs jautājums kļūst par jaunu intelekta testu:
"Automašīnu mazgātava atrodas 40 metru attālumā no manām mājām. Es vēlos nomazgāt savu automašīnu. Vai man vajadzētu iet kājām vai braukt ar automašīnu?"
Modeļi, kas izturēja testu: GPT-5.2 Thinking, Opus 4.6, Gemini 3 Pro Modeļi, kas neizturēja testu: GPT-5.2 Instant, GPT-4o, Haiku 4.5, Sonnet 4.5
Kāpēc šis tests ir nozīmīgs? Jo tas testē "veselo saprātu", nevis "zināšanu izgūšanu". 40 metri ir gājiena attālums. Automašīna ir netīra un jāmazgā. Bet jūs nebrauksiet ar netīru automašīnu 40 metrus, lai to nomazgātu – ja vien jums nav veselā saprāta.
Vēsture neatkārtojas, bet atskaņojas
"Ekspertu sistēmas dzima 1970. gados, uzplauka 1980. gados un tika plaši uzskatītas par AI nākotni." — @ChombaBupe
GPT modeļi dzima 2018. gadā, uzplauka 2020. gados un tiek plaši uzskatīti par AI nākotni.
Ekspertu sistēmu neveiksme nebija saistīta ar to, ka tās nebija pietiekami gudras, bet gan ar to, ka uzturēšanas izmaksas bija pārāk augstas un mērogojamība bija pārāk slikta. Kad zināšanu bāze ir jāuztur manuāli, apjoms ir ienaidnieks.
GPT saskaras ar spoguļproblēmu: modelis ir gudrs, bet spriešanas izmaksas ir pārāk augstas. Kad katrs pieprasījums prasa lielu aprēķinu apjomu, apjoms arī ir ienaidnieks.
Nākamie soļi
Šonedēļ paredzams, ka tiks izlaisti vairāki jauni modeļi: Gemini 3.1 Pro, Claude Sonnet 5, GPT-5.3, DeepSeek V4, Qwen 3.5.
Konkurence pāriet no "kurš ir gudrāks" uz "kurš ir lētāks". Tas ir labas ziņas lietotājiem. OpenAI? Varbūt nē.





