Qwen 3.5 Dilancarkan: Model Berat Terbuka dengan Parameter 397B, Kos Dikurangkan 60%

Alibaba baru sahaja melancarkan Qwen 3.5-397B-A17B. Ini adalah model berat terbuka pertama dalam siri Qwen 3.5.

Data Teras

Jumlah Parameter: 397B
Parameter Aktif: 17B per pass (MoE jarang)
Throughput: 8.6x-19x lebih tinggi daripada Qwen 3-Max
Kos: 60% lebih rendah daripada Qwen 3
Sokongan Bahasa: 201 jenis (diperluaskan daripada 119 jenis)

Ini bukan sekadar timbunan parameter. Ini adalah definisi semula kecekapan.

Qwen 3.5

Inovasi Seni Bina

Qwen 3.5 menggunakan seni bina hibrid:

Gated Delta Networks + MoE jarang
Perhatian Linear Hibrid: Kebanyakan lapisan menggunakan perhatian linear, setiap 4 lapisan menggunakan perhatian penuh
Multimodal Asli: Bukan penambahan kemudian, tetapi dilatih dari awal

Analisis teknikal di X:

"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen

Kepentingan seni bina ini adalah: mencapai prestasi model hampir 400B dengan parameter aktif 17B. Kos inferens menurun dengan ketara.

Tuntutan Prestasi

Alibaba mendakwa Qwen 3.5 mengalahkan:

GPT-5.2
Claude Opus 4.5
Gemini 3 Pro

Penguji bebas di X mula mengesahkan:

"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme

Tetapi yang paling penting bukanlah penanda aras, tetapi keupayaan ejen:

"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly

Era Ejen

Kedudukan Qwen 3.5 adalah jelas: direka untuk era ejen.

Boleh menganalisis video 2 jam
Boleh melaksanakan tugas merentas aplikasi secara bebas
Boleh memahami GUI dan berinteraksi dengannya

"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly

Ini bermakna ia bukan "chatbot", tetapi "pelaksana tugas".

Landskap Persaingan

Seseorang di X meringkaskan pelancaran AI minggu ini:

"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek

Rentak pengeluar model China adalah jelas:

DeepSeek V4
Qwen 3.5
GLM 5
MiniMax 2.5

Setiap minggu ada model baharu, setiap kali mendakwa mengalahkan GPT. Ini bukan pemasaran, ini adalah peningkatan perang kos.

Struktur Kos

Harga token Qwen 3.5 hanya 1/18 daripada Gemini 3 Pro.

"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob

Apabila prestasi hampir sama, dan kos hanya 5%, di manakah parit model sumber tertutup?

Kesimpulan

Qwen 3.5 bukan "GPT China". Ia adalah pengganggu struktur kos:

Parameter 397B, tetapi hanya mengaktifkan 17B
Berat terbuka, boleh digunakan secara tempatan
Keupayaan ejen, bukan sekadar perbualan
Kos hanya 5% daripada pesaing

Ada ramalan menarik di X:

"Qwen 3.5 Q4 版本只需要 225G，很有实用价值" — @janxin

Memerlukan hanya 225GB memori GPU, boleh dijalankan pada mesin tunggal. Ini bermakna pembangun kecil dan sederhana boleh mengakses model yang hampir dengan tahap GPT-5 buat kali pertama.

Soalan sebenar bukanlah sama ada Qwen 3.5 boleh mengalahkan GPT-5.3, tetapi: apabila kos model teratas jatuh hampir kepada sifar, bagaimana syarikat AI menjana wang?

Qwen 3.5 Dilancarkan: Model Berat Terbuka dengan Parameter 397B, Kos Dikurangkan 60%

Data Teras

Inovasi Seni Bina

Tuntutan Prestasi

Era Ejen

Landskap Persaingan

Struktur Kos

Kesimpulan

You Might Also Like

Panduan Pengubahsuaian Claude Code Buddy: Cara Mendapatkan Haiwan Peliharaan Legenda Berkilau

Obsidian Melancarkan Defuddle, Meningkatkan Obsidian Web Clipper ke Tahap Baru

OpenAI Tiba-tiba Mengumumkan "Tiga dalam Satu": Penggabungan Pelayar + Pengaturcaraan + ChatGPT, Mengakui Kesilapan Tahun Lepas

2026, Jangan Paksa Diri Sendiri 'Disiplin'! Lakukan 8 Perkara Kecil Ini, Kesihatan Akan Datang Secara Semula Jadi

Ibu-ibu yang berusaha menurunkan berat badan tetapi tidak berhasil, pasti terjebak di sini

AI Browser 24小时稳定运行指南