Qwen 3.5 Dirilis: Model Bobot Terbuka dengan Parameter 397B, Biaya Turun 60%
Alibaba baru saja merilis Qwen 3.5-397B-A17B. Ini adalah model bobot terbuka pertama dari seri Qwen 3.5.
Data Inti
- Total Parameter: 397B
- Parameter Aktif: 17B per pass (Sparse MoE)
- Throughput: Meningkat 8.6x-19x dibandingkan Qwen 3-Max
- Biaya: Turun 60% dibandingkan Qwen 3
- Dukungan Bahasa: 201 bahasa (diperluas dari 119 bahasa)
Ini bukan sekadar penumpukan parameter. Ini adalah definisi ulang efisiensi.
Inovasi Arsitektur
Qwen 3.5 menggunakan arsitektur campuran:
- Gated Delta Networks + Sparse MoE
- Hybrid Linear Attention: Sebagian besar layer menggunakan linear attention, setiap 4 layer menggunakan full attention
- Native Multimodal: Bukan ditambahkan di kemudian hari, tetapi dilatih dari awal
Ada analisis teknis di X:
"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen
Arti dari arsitektur ini adalah: Mencapai performa model mendekati 400B dengan 17B parameter aktif. Biaya inferensi turun drastis.
Klaim Performa
Alibaba mengklaim Qwen 3.5 mengalahkan:
- GPT-5.2
- Claude Opus 4.5
- Gemini 3 Pro
Penguji independen di X mulai memverifikasi:
"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme
Tetapi yang paling penting bukanlah benchmark, melainkan kemampuan agen:
"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly
Era Agen
Posisi Qwen 3.5 sangat jelas: Dirancang untuk era agen.
- Dapat menganalisis video 2 jam
- Dapat secara mandiri menjalankan tugas lintas aplikasi
- Dapat memahami GUI dan berinteraksi dengannya
"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly
Ini berarti ia bukan "chatbot", melainkan "eksekutor tugas".
Lanskap Kompetisi
Seseorang di X merangkum rilis AI minggu ini:
"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek
Ritme produsen model Tiongkok sangat jelas:
- DeepSeek V4
- Qwen 3.5
- GLM 5
- MiniMax 2.5
Ada model baru setiap minggu, dan setiap kali mengklaim mengalahkan GPT. Ini bukan pemasaran, ini adalah peningkatan perang biaya.
Struktur Biaya
Harga token Qwen 3.5 hanya 1/18 dari Gemini 3 Pro.
"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob
Ketika performa mendekati, dan biaya hanya 5%, di mana letak benteng model tertutup?
Intinya
Qwen 3.5 bukan "GPT dari Tiongkok". Ini adalah pendobrak struktur biaya:
- 397B parameter, tetapi hanya mengaktifkan 17B
- Bobot terbuka, dapat di-deploy secara lokal
- Kemampuan agen, bukan hanya percakapan
- Biaya hanya 5% dari pesaing
Ada prediksi menarik di X:
"Qwen 3.5 Q4 版本只需要 225G,很有实用价值" — @janxin
(Qwen 3.5 versi Q4 hanya membutuhkan 225G, sangat praktis)
225GB VRAM, dapat dijalankan di satu mesin. Ini berarti pengembang kecil dan menengah untuk pertama kalinya dapat mengakses model yang mendekati level GPT-5.
Masalah sebenarnya bukanlah apakah Qwen 3.5 dapat mengalahkan GPT-5.3, tetapi: Ketika biaya model top turun mendekati nol, bagaimana perusahaan AI menghasilkan uang?





