Tembok Kos GPT

2/17/2026
3 min read

Dalam seminggu yang lalu, perbincangan mengenai GPT di X telah memfokuskan perhatian baharu: bukan keupayaan, tetapi kos.

ARC-AGI: Sempadan Kecerdasan

Prestasi model yang paling canggih pada masa ini di ARC-AGI-2:

ModelSkor ARC-AGI-2
GPT-5.2 Pro~54%
GPT-5.2 Refine~73%
Manusia100%

Perbezaan antara 54% dan 73% bukanlah masalah kecerdasan, tetapi "penghalusan" - membiarkan model menyemak jawapannya berulang kali. Ini memerlukan lebih banyak pengiraan, yang bermaksud kos yang lebih tinggi.

Kos Sebenar Agent

Kos tahunan Agent peringkat perusahaan 24/7 (20 juta input + 20 juta output token setiap hari):

ModelKos Tahunan
Palmyra X5~$48K
GPT-5.2 Standard~$57K
Gemini 2.5 Pro~$82K
Claude Sonnet 4.5~$131K
Claude Opus 4.6~$219K
GPT-5.2 Pro~$690K

GPT-5.2 Pro adalah 12 kali lebih mahal daripada GPT-5.2 Standard. Ini bukan masalah strategi harga, tetapi masalah struktur kos.

"Sebelum anda menggunakan 100 ejen AI, jalankan pengiraan." — @waseem_s

Ujian Turing Baharu

Soalan mudah menjadi ujian kecerdasan baharu:

"Kedai cuci kereta terletak 40 meter dari rumah saya. Saya mahu mencuci kereta saya. Patutkah saya berjalan atau memandu ke sana?"

Model yang lulus: GPT-5.2 Thinking, Opus 4.6, Gemini 3 Pro Model yang gagal: GPT-5.2 Instant, GPT-4o, Haiku 4.5, Sonnet 4.5

Mengapa ujian ini bermakna? Kerana ia menguji "penaakulan akal" dan bukannya "pengambilan pengetahuan". 40 meter adalah jarak berjalan kaki. Kereta kotor perlu dicuci. Tetapi anda tidak akan memandu kereta kotor sejauh 40 meter untuk mencucinya - melainkan anda tidak memahami akal.

Sejarah Tidak Berulang, Tetapi Berima

"Sistem pakar dilahirkan pada tahun 1970-an, berkembang pesat pada tahun 1980-an, dan secara meluas dianggap sebagai masa depan AI." — @ChombaBupe

Model GPT dilahirkan pada tahun 2018, berkembang pesat pada tahun 2020-an, dan secara meluas dianggap sebagai masa depan AI.

Kegagalan sistem pakar bukan kerana mereka tidak cukup pintar, tetapi kerana kos penyelenggaraan terlalu tinggi dan kebolehskalaan terlalu lemah. Apabila pangkalan pengetahuan memerlukan penyelenggaraan manual, skala adalah musuh.

GPT menghadapi masalah cermin: modelnya pintar, tetapi kos penaakulan terlalu tinggi. Apabila setiap permintaan memerlukan banyak pengiraan, skala juga merupakan musuh.

Langkah Seterusnya

Beberapa model baharu dijangka dikeluarkan minggu ini: Gemini 3.1 Pro, Claude Sonnet 5, GPT-5.3, DeepSeek V4, Qwen 3.5.

Persaingan beralih daripada "siapa yang lebih pintar" kepada "siapa yang lebih murah". Ini adalah berita baik untuk pengguna. Untuk OpenAI? Belum tentu.

Published in Technology

You Might Also Like