Qwen 3.5 avaldamine: 397B parameetriga avatud kaaludega mudel, kulud 60% madalamad

2/16/2026
3 min read

Alibaba avaldas just Qwen 3.5-397B-A17B. See on Qwen 3.5 seeria esimene avatud kaaludega mudel.

Põhiandmed

  • Koguparameetrid: 397B
  • Aktiivsed parameetrid: 17B per pass (hõre MoE)
  • Läbilaskevõime: 8.6x-19x suurem kui Qwen 3-Max
  • Maksumus: 60% madalam kui Qwen 3
  • Keeletugi: 201 keelt (laiendatud 119-lt)

See ei ole lihtsalt parameetrite kuhjamine. See on tõhususe ümberdefineerimine.

Qwen 3.5

Arhitektuuri uuendus

Qwen 3.5 kasutab hübriidarhitektuuri:

  • Gated Delta Networks + hõre MoE
  • Hübriidne lineaarne tähelepanu: enamik kihte kasutab lineaarset tähelepanu, iga 4 kihi järel kasutatakse täielikku tähelepanu
  • Natiivne multimodality: ei ole hiljem lisatud, vaid on algusest peale treenitud

X-is on tehniline analüüs:

"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen

Selle arhitektuuri tähendus on: 17B aktiivsete parameetritega saavutatakse ligi 400B mudeli jõudlus. Järelduskulud on oluliselt vähenenud.

Jõudlusnõuded

Alibaba väidab, et Qwen 3.5 ületas:

  • GPT-5.2
  • Claude Opus 4.5
  • Gemini 3 Pro

X-is alustavad sõltumatud testijad valideerimist:

"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme

Kuid kõige olulisem pole võrdlustestid, vaid agendi võimekus:

"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly

Agendi ajastu

Qwen 3.5 positsioon on selge: mõeldud agendi ajastuks.

  • Saab analüüsida 2-tunnist videot
  • Saab iseseisvalt täita rakendusteüleseid ülesandeid
  • Saab aru GUI-st ja suhelda sellega

"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly

See tähendab, et see pole "juturobot", vaid "ülesannete täitja".

Konkurentsimaastik

X-is keegi võttis kokku selle nädala AI väljaanded:

"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek

Hiina mudelitootjate rütm on selge:

  • DeepSeek V4
  • Qwen 3.5
  • GLM 5
  • MiniMax 2.5

Igal nädalal on uus mudel ja iga kord väidetakse, et see ületab GPT. See pole turundus, see on kulude sõja eskaleerumine.

Kulustruktuur

Qwen 3.5 tokeni hind on ainult 1/18 Gemini 3 Pro omast.

"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob

Kui jõudlus on lähedane ja maksumus on ainult 5%, kus on suletud lähtekoodiga mudelite kaitsekraav?

Kokkuvõte

Qwen 3.5 ei ole "Hiina GPT". See on kulustruktuuri ümberpööraja:

  1. 397B parameetrit, kuid aktiveeritakse ainult 17B
  2. Avatud kaalud, saab kohapeal juurutada
  3. Agendi võimekus, mitte ainult dialoog
  4. Maksumus on ainult 5% konkurentide omast

X-is on huvitav ennustus:

"Qwen 3.5 Q4 版本只需要 225G,很有实用价值" — @janxin

225 GB videokaardi mälu, saab käivitada ühel masinal. See tähendab, et väikesed ja keskmise suurusega arendajad saavad esimest korda ligi GPT-5 tasemel mudelile.

Tegelik küsimus pole selles, kas Qwen 3.5 suudab GPT-5.3 ületada, vaid: kuidas AI ettevõtted raha teenivad, kui tipptasemel mudelite maksumus langeb peaaegu nullini?

Published in Technology

You Might Also Like