LLM Adalah JPEG Berikutnya
Izinkan saya bercerita.
Pada tahun 1990-an, jika Anda ingin mengirim foto ke orang lain, Anda perlu mempertimbangkan banyak hal: format file, algoritma kompresi, kedalaman warna. Setiap perangkat lunak memiliki formatnya sendiri. Kemudian JPEG muncul.
Tiba-tiba, tidak ada yang peduli lagi dengan format gambar. JPEG menjadi infrastruktur. Anda tidak akan mengatakan "Saya membuat gambar menggunakan JPEG", Anda hanya mengatakan "Saya mengirim gambar".
LLM sedang menempuh jalan yang sama.
Ketika Teknologi Menjadi Udara
"LLM adalah komoditas. Apple dengan senang hati membeli token dari perusahaan LLM, tetapi Apple adalah perusahaan yang menjual produk yang terdiferensiasi." — @deuteronormative
Kalimat ini sangat blak-blakan. Jika Anda adalah Apple, Anda tidak akan menghasilkan listrik sendiri, Anda membeli listrik dari jaringan listrik. Anda tidak akan membuat ban sendiri, Anda membeli ban dari Michelin. Sekarang, Anda juga tidak akan melatih LLM sendiri, Anda membeli token dari cloud.
Ini bukan berarti LLM tidak penting. Listrik itu penting. Ban itu penting. Tetapi mereka adalah infrastruktur, bukan faktor pembeda.
Pemenang Perang Biaya
Qwen 3.5 yang baru saja dirilis oleh Alibaba:
- 397 miliar parameter, 17 miliar aktivasi
- 60% lebih murah dari Qwen 3
- 8 kali lebih cepat
- Harga Token adalah 1/18 dari Gemini 3 Pro
Ini bukan terobosan teknologi, ini adalah perang harga. Dulu TV LCD juga turun harga seperti ini. Perusahaan pertama yang harganya di bawah 1000 dolar AS bukanlah yang terbaik secara teknologi, tetapi dialah pemenangnya.
Saran Pragmatis
Jika Anda seorang pengembang, apa artinya ini?
-
Jangan melatih model sendiri. Kecuali Anda adalah OpenAI, Anthropic, atau Alibaba, melatih model adalah pemborosan uang. Gunakan API.
-
Fokus pada harga daripada parameter. 397 miliar parameter terdengar keren, tetapi pengguna Anda tidak peduli. Yang mereka pedulikan adalah kecepatan respons dan biaya.
-
Bersiaplah untuk bermigrasi. LLM adalah komoditas, yang berarti dapat diganti. Hari ini menggunakan GPT, besok menggunakan Claude, lusa menggunakan Qwen. Arsitektur Anda harus mendukung peralihan ini.
Paradoks yang Menarik
Orang yang paling mengerti LLM justru tidak banyak berbicara tentang LLM.
"Andrej Karpathy menulis mini GPT dengan 240 baris Python murni. Tanpa TensorFlow. Tanpa PyTorch. Hanya matematika. Ini menunjukkan bahwa LLM bukanlah sihir—mereka hanyalah prediksi token berikutnya."
Ketika Anda memahami bahwa "prediksi token berikutnya" adalah inti dari teknologi ini, banyak hype menghilang. Ini bukan merendahkan. Microwave hanya memanaskan molekul air, tetapi itu mengubah dapur.
Langkah Selanjutnya
LLM akan menjadi seperti JPEG: ada di mana-mana, tidak ada yang membicarakannya, tetapi sangat diperlukan.
Sebelum itu, orang pintar akan memilih pemasok termurah dalam perang harga. Karena ketika teknologi menjadi komoditas, satu-satunya hal yang penting adalah biaya.





