Qwen 3.5 Dirilis: Model Bobot Terbuka dengan Parameter 397B, Biaya Turun 60%

2/16/2026
3 min read

Alibaba baru saja merilis Qwen 3.5-397B-A17B. Ini adalah model bobot terbuka pertama dari seri Qwen 3.5.

Data Inti

  • Total Parameter: 397B
  • Parameter Aktif: 17B per pass (Sparse MoE)
  • Throughput: Meningkat 8.6x-19x dibandingkan Qwen 3-Max
  • Biaya: Turun 60% dibandingkan Qwen 3
  • Dukungan Bahasa: 201 bahasa (diperluas dari 119 bahasa)

Ini bukan sekadar penumpukan parameter. Ini adalah definisi ulang efisiensi.

Qwen 3.5

Inovasi Arsitektur

Qwen 3.5 menggunakan arsitektur campuran:

  • Gated Delta Networks + Sparse MoE
  • Hybrid Linear Attention: Sebagian besar layer menggunakan linear attention, setiap 4 layer menggunakan full attention
  • Native Multimodal: Bukan ditambahkan di kemudian hari, tetapi dilatih dari awal

Ada analisis teknis di X:

"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen

Arti dari arsitektur ini adalah: Mencapai performa model mendekati 400B dengan 17B parameter aktif. Biaya inferensi turun drastis.

Klaim Performa

Alibaba mengklaim Qwen 3.5 mengalahkan:

  • GPT-5.2
  • Claude Opus 4.5
  • Gemini 3 Pro

Penguji independen di X mulai memverifikasi:

"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme

Tetapi yang paling penting bukanlah benchmark, melainkan kemampuan agen:

"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly

Era Agen

Posisi Qwen 3.5 sangat jelas: Dirancang untuk era agen.

  • Dapat menganalisis video 2 jam
  • Dapat secara mandiri menjalankan tugas lintas aplikasi
  • Dapat memahami GUI dan berinteraksi dengannya

"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly

Ini berarti ia bukan "chatbot", melainkan "eksekutor tugas".

Lanskap Kompetisi

Seseorang di X merangkum rilis AI minggu ini:

"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek

Ritme produsen model Tiongkok sangat jelas:

  • DeepSeek V4
  • Qwen 3.5
  • GLM 5
  • MiniMax 2.5

Ada model baru setiap minggu, dan setiap kali mengklaim mengalahkan GPT. Ini bukan pemasaran, ini adalah peningkatan perang biaya.

Struktur Biaya

Harga token Qwen 3.5 hanya 1/18 dari Gemini 3 Pro.

"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob

Ketika performa mendekati, dan biaya hanya 5%, di mana letak benteng model tertutup?

Intinya

Qwen 3.5 bukan "GPT dari Tiongkok". Ini adalah pendobrak struktur biaya:

  1. 397B parameter, tetapi hanya mengaktifkan 17B
  2. Bobot terbuka, dapat di-deploy secara lokal
  3. Kemampuan agen, bukan hanya percakapan
  4. Biaya hanya 5% dari pesaing

Ada prediksi menarik di X:

"Qwen 3.5 Q4 版本只需要 225G,很有实用价值" — @janxin

(Qwen 3.5 versi Q4 hanya membutuhkan 225G, sangat praktis)

225GB VRAM, dapat dijalankan di satu mesin. Ini berarti pengembang kecil dan menengah untuk pertama kalinya dapat mengakses model yang mendekati level GPT-5.

Masalah sebenarnya bukanlah apakah Qwen 3.5 dapat mengalahkan GPT-5.3, tetapi: Ketika biaya model top turun mendekati nol, bagaimana perusahaan AI menghasilkan uang?

Published in Technology

You Might Also Like