Qwen 3.5 Dilancarkan: Model Berat Terbuka dengan Parameter 397B, Kos Dikurangkan 60%
Alibaba baru sahaja melancarkan Qwen 3.5-397B-A17B. Ini adalah model berat terbuka pertama dalam siri Qwen 3.5.
Data Teras
- Jumlah Parameter: 397B
- Parameter Aktif: 17B per pass (MoE jarang)
- Throughput: 8.6x-19x lebih tinggi daripada Qwen 3-Max
- Kos: 60% lebih rendah daripada Qwen 3
- Sokongan Bahasa: 201 jenis (diperluaskan daripada 119 jenis)
Ini bukan sekadar timbunan parameter. Ini adalah definisi semula kecekapan.

Inovasi Seni Bina
Qwen 3.5 menggunakan seni bina hibrid:
- Gated Delta Networks + MoE jarang
- Perhatian Linear Hibrid: Kebanyakan lapisan menggunakan perhatian linear, setiap 4 lapisan menggunakan perhatian penuh
- Multimodal Asli: Bukan penambahan kemudian, tetapi dilatih dari awal
Analisis teknikal di X:
"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen
Kepentingan seni bina ini adalah: mencapai prestasi model hampir 400B dengan parameter aktif 17B. Kos inferens menurun dengan ketara.
Tuntutan Prestasi
Alibaba mendakwa Qwen 3.5 mengalahkan:
- GPT-5.2
- Claude Opus 4.5
- Gemini 3 Pro
Penguji bebas di X mula mengesahkan:
"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme
Tetapi yang paling penting bukanlah penanda aras, tetapi keupayaan ejen:
"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly
Era Ejen
Kedudukan Qwen 3.5 adalah jelas: direka untuk era ejen.
- Boleh menganalisis video 2 jam
- Boleh melaksanakan tugas merentas aplikasi secara bebas
- Boleh memahami GUI dan berinteraksi dengannya
"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly
Ini bermakna ia bukan "chatbot", tetapi "pelaksana tugas".
Landskap Persaingan
Seseorang di X meringkaskan pelancaran AI minggu ini:
"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek
Rentak pengeluar model China adalah jelas:
- DeepSeek V4
- Qwen 3.5
- GLM 5
- MiniMax 2.5
Setiap minggu ada model baharu, setiap kali mendakwa mengalahkan GPT. Ini bukan pemasaran, ini adalah peningkatan perang kos.
Struktur Kos
Harga token Qwen 3.5 hanya 1/18 daripada Gemini 3 Pro.
"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob
Apabila prestasi hampir sama, dan kos hanya 5%, di manakah parit model sumber tertutup?
Kesimpulan
Qwen 3.5 bukan "GPT China". Ia adalah pengganggu struktur kos:
- Parameter 397B, tetapi hanya mengaktifkan 17B
- Berat terbuka, boleh digunakan secara tempatan
- Keupayaan ejen, bukan sekadar perbualan
- Kos hanya 5% daripada pesaing
Ada ramalan menarik di X:
"Qwen 3.5 Q4 版本只需要 225G,很有实用价值" — @janxin
Memerlukan hanya 225GB memori GPU, boleh dijalankan pada mesin tunggal. Ini bermakna pembangun kecil dan sederhana boleh mengakses model yang hampir dengan tahap GPT-5 buat kali pertama.
Soalan sebenar bukanlah sama ada Qwen 3.5 boleh mengalahkan GPT-5.3, tetapi: apabila kos model teratas jatuh hampir kepada sifar, bagaimana syarikat AI menjana wang?





