Qwen 3.5 Dilancarkan: Model Berat Terbuka dengan Parameter 397B, Kos Dikurangkan 60%

2/16/2026
3 min read

Alibaba baru sahaja melancarkan Qwen 3.5-397B-A17B. Ini adalah model berat terbuka pertama dalam siri Qwen 3.5.

Data Teras

  • Jumlah Parameter: 397B
  • Parameter Aktif: 17B per pass (MoE jarang)
  • Throughput: 8.6x-19x lebih tinggi daripada Qwen 3-Max
  • Kos: 60% lebih rendah daripada Qwen 3
  • Sokongan Bahasa: 201 jenis (diperluaskan daripada 119 jenis)

Ini bukan sekadar timbunan parameter. Ini adalah definisi semula kecekapan.

Qwen 3.5

Inovasi Seni Bina

Qwen 3.5 menggunakan seni bina hibrid:

  • Gated Delta Networks + MoE jarang
  • Perhatian Linear Hibrid: Kebanyakan lapisan menggunakan perhatian linear, setiap 4 lapisan menggunakan perhatian penuh
  • Multimodal Asli: Bukan penambahan kemudian, tetapi dilatih dari awal

Analisis teknikal di X:

"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen

Kepentingan seni bina ini adalah: mencapai prestasi model hampir 400B dengan parameter aktif 17B. Kos inferens menurun dengan ketara.

Tuntutan Prestasi

Alibaba mendakwa Qwen 3.5 mengalahkan:

  • GPT-5.2
  • Claude Opus 4.5
  • Gemini 3 Pro

Penguji bebas di X mula mengesahkan:

"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme

Tetapi yang paling penting bukanlah penanda aras, tetapi keupayaan ejen:

"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly

Era Ejen

Kedudukan Qwen 3.5 adalah jelas: direka untuk era ejen.

  • Boleh menganalisis video 2 jam
  • Boleh melaksanakan tugas merentas aplikasi secara bebas
  • Boleh memahami GUI dan berinteraksi dengannya

"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly

Ini bermakna ia bukan "chatbot", tetapi "pelaksana tugas".

Landskap Persaingan

Seseorang di X meringkaskan pelancaran AI minggu ini:

"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek

Rentak pengeluar model China adalah jelas:

  • DeepSeek V4
  • Qwen 3.5
  • GLM 5
  • MiniMax 2.5

Setiap minggu ada model baharu, setiap kali mendakwa mengalahkan GPT. Ini bukan pemasaran, ini adalah peningkatan perang kos.

Struktur Kos

Harga token Qwen 3.5 hanya 1/18 daripada Gemini 3 Pro.

"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob

Apabila prestasi hampir sama, dan kos hanya 5%, di manakah parit model sumber tertutup?

Kesimpulan

Qwen 3.5 bukan "GPT China". Ia adalah pengganggu struktur kos:

  1. Parameter 397B, tetapi hanya mengaktifkan 17B
  2. Berat terbuka, boleh digunakan secara tempatan
  3. Keupayaan ejen, bukan sekadar perbualan
  4. Kos hanya 5% daripada pesaing

Ada ramalan menarik di X:

"Qwen 3.5 Q4 版本只需要 225G,很有实用价值" — @janxin

Memerlukan hanya 225GB memori GPU, boleh dijalankan pada mesin tunggal. Ini bermakna pembangun kecil dan sederhana boleh mengakses model yang hampir dengan tahap GPT-5 buat kali pertama.

Soalan sebenar bukanlah sama ada Qwen 3.5 boleh mengalahkan GPT-5.3, tetapi: apabila kos model teratas jatuh hampir kepada sifar, bagaimana syarikat AI menjana wang?

Published in Technology

You Might Also Like