Lansare Qwen 3.5: Model cu greutăți deschise de 397B parametri, cost redus cu 60%

2/16/2026
3 min read

Alibaba tocmai a lansat Qwen 3.5-397B-A17B. Acesta este primul model cu greutăți deschise din seria Qwen 3.5.

Date esențiale

  • Parametri totali: 397B
  • Parametri activi: 17B per pass (MoE rar)
  • Throughput: Îmbunătățire de 8.6x-19x față de Qwen 3-Max
  • Cost: Reducere cu 60% față de Qwen 3
  • Suport lingvistic: 201 limbi (extins de la 119)

Nu este o simplă stivuire de parametri. Este o redefinire a eficienței.

Qwen 3.5

Inovație arhitecturală

Qwen 3.5 folosește o arhitectură hibridă:

  • Gated Delta Networks + MoE rar
  • Atenție liniară hibridă: Majoritatea straturilor folosesc atenție liniară, fiecare 4 straturi folosesc atenție completă
  • Multimodal nativ: Nu este adăugat ulterior, ci antrenat de la zero

Există analize tehnice pe X:

"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen

Semnificația acestei arhitecturi este: realizarea performanței unui model de aproape 400B cu 17B parametri activi. Costul de inferență scade semnificativ.

Afirmații de performanță

Alibaba susține că Qwen 3.5 a depășit:

  • GPT-5.2
  • Claude Opus 4.5
  • Gemini 3 Pro

Testeri independenți pe X au început să valideze:

"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme

Dar cel mai important nu este testarea comparativă, ci capacitatea de agent:

"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly

Era agenților

Poziționarea Qwen 3.5 este clară: proiectat pentru era agenților.

  • Poate analiza videoclipuri de 2 ore
  • Poate executa independent sarcini între aplicații
  • Poate înțelege GUI-uri și poate interacționa cu ele

"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly

Aceasta înseamnă că nu este un „chatbot”, ci un „executor de sarcini”.

Peisajul concurențial

Cineva pe X a rezumat lansările AI din această săptămână:

"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek

Ritmul producătorilor de modele chinezi este clar:

  • DeepSeek V4
  • Qwen 3.5
  • GLM 5
  • MiniMax 2.5

Există modele noi în fiecare săptămână, fiecare susținând că depășește GPT. Nu este marketing, este o escaladare a războiului costurilor.

Structura costurilor

Prețul token-ului Qwen 3.5 este doar 1/18 din cel al Gemini 3 Pro.

"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob

Când performanța este apropiată, iar costul este de doar 5%, unde este șanțul de apărare al modelelor cu sursă închisă?

Concluzie

Qwen 3.5 nu este „GPT-ul chinezesc”. Este un perturbator al structurii costurilor:

  1. 397B parametri, dar activează doar 17B
  2. Greutăți deschise, pot fi implementate local
  3. Capacitate de agent, nu doar conversație
  4. Costul este doar 5% din cel al concurenților

Există o predicție interesantă pe X:

"Qwen 3.5 Q4 版本只需要 225G,很有实用价值" — @janxin

225GB memorie video, poate rula pe o singură mașină. Aceasta înseamnă că dezvoltatorii mici și mijlocii pot accesa pentru prima dată un model de nivel GPT-5.

Întrebarea reală nu este dacă Qwen 3.5 poate depăși GPT-5.3, ci: când costul modelelor de top scade aproape de zero, cum fac companiile AI bani?

Published in Technology

You Might Also Like