Tembok Kos GPT

Dalam seminggu yang lalu, perbincangan mengenai GPT di X telah memfokuskan perhatian baharu: bukan keupayaan, tetapi kos.

ARC-AGI: Sempadan Kecerdasan

Prestasi model yang paling canggih pada masa ini di ARC-AGI-2:

Model	Skor ARC-AGI-2
GPT-5.2 Pro	~54%
GPT-5.2 Refine	~73%
Manusia	100%

Perbezaan antara 54% dan 73% bukanlah masalah kecerdasan, tetapi "penghalusan" - membiarkan model menyemak jawapannya berulang kali. Ini memerlukan lebih banyak pengiraan, yang bermaksud kos yang lebih tinggi.

Kos Sebenar Agent

Kos tahunan Agent peringkat perusahaan 24/7 (20 juta input + 20 juta output token setiap hari):

Model	Kos Tahunan
Palmyra X5	~$48K
GPT-5.2 Standard	~$57K
Gemini 2.5 Pro	~$82K
Claude Sonnet 4.5	~$131K
Claude Opus 4.6	~$219K
GPT-5.2 Pro	~$690K

GPT-5.2 Pro adalah 12 kali lebih mahal daripada GPT-5.2 Standard. Ini bukan masalah strategi harga, tetapi masalah struktur kos.

"Sebelum anda menggunakan 100 ejen AI, jalankan pengiraan." — @waseem_s

Ujian Turing Baharu

Soalan mudah menjadi ujian kecerdasan baharu:

"Kedai cuci kereta terletak 40 meter dari rumah saya. Saya mahu mencuci kereta saya. Patutkah saya berjalan atau memandu ke sana?"

Model yang lulus: GPT-5.2 Thinking, Opus 4.6, Gemini 3 Pro Model yang gagal: GPT-5.2 Instant, GPT-4o, Haiku 4.5, Sonnet 4.5

Mengapa ujian ini bermakna? Kerana ia menguji "penaakulan akal" dan bukannya "pengambilan pengetahuan". 40 meter adalah jarak berjalan kaki. Kereta kotor perlu dicuci. Tetapi anda tidak akan memandu kereta kotor sejauh 40 meter untuk mencucinya - melainkan anda tidak memahami akal.

Sejarah Tidak Berulang, Tetapi Berima

"Sistem pakar dilahirkan pada tahun 1970-an, berkembang pesat pada tahun 1980-an, dan secara meluas dianggap sebagai masa depan AI." — @ChombaBupe

Model GPT dilahirkan pada tahun 2018, berkembang pesat pada tahun 2020-an, dan secara meluas dianggap sebagai masa depan AI.

Kegagalan sistem pakar bukan kerana mereka tidak cukup pintar, tetapi kerana kos penyelenggaraan terlalu tinggi dan kebolehskalaan terlalu lemah. Apabila pangkalan pengetahuan memerlukan penyelenggaraan manual, skala adalah musuh.

GPT menghadapi masalah cermin: modelnya pintar, tetapi kos penaakulan terlalu tinggi. Apabila setiap permintaan memerlukan banyak pengiraan, skala juga merupakan musuh.

Langkah Seterusnya

Beberapa model baharu dijangka dikeluarkan minggu ini: Gemini 3.1 Pro, Claude Sonnet 5, GPT-5.3, DeepSeek V4, Qwen 3.5.

Persaingan beralih daripada "siapa yang lebih pintar" kepada "siapa yang lebih murah". Ini adalah berita baik untuk pengguna. Untuk OpenAI? Belum tentu.

Tembok Kos GPT

ARC-AGI: Sempadan Kecerdasan

Kos Sebenar Agent

Ujian Turing Baharu

Sejarah Tidak Berulang, Tetapi Berima

Langkah Seterusnya

You Might Also Like

Panduan Pengubahsuaian Claude Code Buddy: Cara Mendapatkan Haiwan Peliharaan Legenda Berkilau

Obsidian Melancarkan Defuddle, Meningkatkan Obsidian Web Clipper ke Tahap Baru

OpenAI Tiba-tiba Mengumumkan "Tiga dalam Satu": Penggabungan Pelayar + Pengaturcaraan + ChatGPT, Mengakui Kesilapan Tahun Lepas

2026, Jangan Paksa Diri Sendiri 'Disiplin'! Lakukan 8 Perkara Kecil Ini, Kesihatan Akan Datang Secara Semula Jadi

Ibu-ibu yang berusaha menurunkan berat badan tetapi tidak berhasil, pasti terjebak di sini

AI Browser 24小时稳定运行指南