LLM Adalah JPEG Seterusnya
Izinkan saya bercerita.
Pada tahun 1990-an, jika anda ingin menghantar gambar kepada seseorang, anda perlu mempertimbangkan banyak perkara: format fail, algoritma pemampatan, kedalaman warna. Setiap perisian mempunyai formatnya sendiri. Kemudian JPEG muncul.
Tiba-tiba, tiada siapa yang peduli tentang format gambar lagi. JPEG menjadi infrastruktur. Anda tidak akan berkata "Saya membuat gambar menggunakan JPEG", anda hanya berkata "Saya menghantar gambar".
LLM sedang melalui jalan yang sama.
Apabila Teknologi Menjadi Udara
"LLM adalah komoditi. Apple gembira untuk membeli token daripada syarikat LLM, tetapi Apple adalah syarikat yang menjual produk yang dibezakan." — @deuteronormative
Kenyataan ini terus terang. Jika anda adalah Apple, anda tidak akan menjana elektrik sendiri, anda membeli elektrik daripada grid. Anda tidak akan membuat tayar sendiri, anda membeli tayar daripada Michelin. Sekarang, anda juga tidak akan melatih LLM sendiri, anda membeli token daripada awan.
Ini tidak bermakna LLM tidak penting. Elektrik adalah penting. Tayar adalah penting. Tetapi ia adalah infrastruktur, bukan faktor pembezaan.
Pemenang Perang Kos
Qwen 3.5 yang baru dikeluarkan oleh Alibaba:
- 397 bilion parameter, 17 bilion diaktifkan
- 60% lebih murah daripada Qwen 3
- 8 kali lebih pantas
- Harga token adalah 1/18 daripada Gemini 3 Pro
Ini bukan penemuan teknologi, ini adalah perang harga. TV LCD juga menurunkan harga dengan cara ini pada masa lalu. Syarikat pertama yang jatuh di bawah $1000 USD bukanlah yang terbaik dari segi teknologi, tetapi ia adalah pemenang.
Nasihat Pragmatik
Jika anda seorang pembangun, apakah maksudnya?
-
Jangan latih model sendiri. Kecuali anda adalah OpenAI, Anthropic atau Alibaba, melatih model adalah membazirkan wang. Gunakan API.
-
Fokus pada harga dan bukannya parameter. 397 bilion parameter kedengaran hebat, tetapi pengguna anda tidak peduli. Mereka mengambil berat tentang kelajuan tindak balas dan kos.
-
Bersedia untuk berhijrah. LLM adalah komoditi, bermakna ia boleh diganti. Hari ini gunakan GPT, esok gunakan Claude, lusa gunakan Qwen. Seni bina anda harus menyokong pertukaran ini.
Paradoks Menarik
Orang yang paling memahami LLM sebenarnya tidak banyak bercakap tentang LLM.
"Andrej Karpathy menulis GPT mini dengan 240 baris Python tulen. Tiada TensorFlow. Tiada PyTorch. Hanya matematik. Ia menunjukkan bahawa LLM bukanlah sihir—ia hanyalah ramalan token seterusnya."
Apabila anda memahami bahawa "ramalan token seterusnya" adalah segala-galanya tentang teknologi ini, banyak gembar-gembur hilang. Ini bukan merendahkan. Ketuhar gelombang mikro hanyalah memanaskan molekul air, tetapi ia mengubah dapur.
Langkah Seterusnya
LLM akan menjadi seperti JPEG: di mana-mana, tiada siapa yang membincangkannya, tetapi sangat diperlukan.
Sehingga itu, orang yang bijak akan memilih pembekal termurah dalam perang harga. Kerana apabila teknologi dikomoditikan, satu-satunya perkara yang penting ialah kos.





