Qwen 3.5 Dirilis: Model Bobot Terbuka dengan Parameter 397B, Biaya Turun 60%

Alibaba baru saja merilis Qwen 3.5-397B-A17B. Ini adalah model bobot terbuka pertama dari seri Qwen 3.5.

Data Inti

Total Parameter: 397B
Parameter Aktif: 17B per pass (Sparse MoE)
Throughput: Meningkat 8.6x-19x dibandingkan Qwen 3-Max
Biaya: Turun 60% dibandingkan Qwen 3
Dukungan Bahasa: 201 bahasa (diperluas dari 119 bahasa)

Ini bukan sekadar penumpukan parameter. Ini adalah definisi ulang efisiensi.

Inovasi Arsitektur

Qwen 3.5 menggunakan arsitektur campuran:

Gated Delta Networks + Sparse MoE
Hybrid Linear Attention: Sebagian besar layer menggunakan linear attention, setiap 4 layer menggunakan full attention
Native Multimodal: Bukan ditambahkan di kemudian hari, tetapi dilatih dari awal

Ada analisis teknis di X:

"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen

Arti dari arsitektur ini adalah: Mencapai performa model mendekati 400B dengan 17B parameter aktif. Biaya inferensi turun drastis.

Klaim Performa

Alibaba mengklaim Qwen 3.5 mengalahkan:

GPT-5.2
Claude Opus 4.5
Gemini 3 Pro

Penguji independen di X mulai memverifikasi:

"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme

Tetapi yang paling penting bukanlah benchmark, melainkan kemampuan agen:

"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly

Era Agen

Posisi Qwen 3.5 sangat jelas: Dirancang untuk era agen.

Dapat menganalisis video 2 jam
Dapat secara mandiri menjalankan tugas lintas aplikasi
Dapat memahami GUI dan berinteraksi dengannya

"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly

Ini berarti ia bukan "chatbot", melainkan "eksekutor tugas".

Lanskap Kompetisi

Seseorang di X merangkum rilis AI minggu ini:

"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek

Ritme produsen model Tiongkok sangat jelas:

DeepSeek V4
Qwen 3.5
GLM 5
MiniMax 2.5

Ada model baru setiap minggu, dan setiap kali mengklaim mengalahkan GPT. Ini bukan pemasaran, ini adalah peningkatan perang biaya.

Struktur Biaya

Harga token Qwen 3.5 hanya 1/18 dari Gemini 3 Pro.

"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob

Ketika performa mendekati, dan biaya hanya 5%, di mana letak benteng model tertutup?

Intinya

Qwen 3.5 bukan "GPT dari Tiongkok". Ini adalah pendobrak struktur biaya:

397B parameter, tetapi hanya mengaktifkan 17B
Bobot terbuka, dapat di-deploy secara lokal
Kemampuan agen, bukan hanya percakapan
Biaya hanya 5% dari pesaing

Ada prediksi menarik di X:

"Qwen 3.5 Q4 版本只需要 225G，很有实用价值" — @janxin

(Qwen 3.5 versi Q4 hanya membutuhkan 225G, sangat praktis)

225GB VRAM, dapat dijalankan di satu mesin. Ini berarti pengembang kecil dan menengah untuk pertama kalinya dapat mengakses model yang mendekati level GPT-5.

Masalah sebenarnya bukanlah apakah Qwen 3.5 dapat mengalahkan GPT-5.3, tetapi: Ketika biaya model top turun mendekati nol, bagaimana perusahaan AI menghasilkan uang?

Qwen 3.5 Dirilis: Model Bobot Terbuka dengan Parameter 397B, Biaya Turun 60%

Data Inti

Inovasi Arsitektur

Klaim Performa

Era Agen

Lanskap Kompetisi

Struktur Biaya

Intinya

You Might Also Like

Panduan Modifikasi Claude Code Buddy: Cara Mendapatkan Hewan Peliharaan Legendaris Bersinar

Obsidian Meluncurkan Defuddle, Meningkatkan Obsidian Web Clipper ke Tingkat Baru

OpenAI Tiba-tiba Mengumumkan "Tiga dalam Satu": Penggabungan Browser + Pemrograman + ChatGPT, Mengakui Kesalahan Tahun Lalu

2026, Jangan Lagi Memaksa Diri untuk 'Disiplin'! Lakukan 8 Hal Kecil Ini, Kesehatan Akan Datang Secara Alami

Ibu-Ibu yang Berusaha Menurunkan Berat Badan tetapi Tidak Berhasil, Pasti Terjebak di Sini

Panduan Menjalankan AI Browser 24 Jam Secara Stabil