Qwen 3.5 avaldamine: 397B parameetriga avatud kaaludega mudel, kulud 60% madalamad
Alibaba avaldas just Qwen 3.5-397B-A17B. See on Qwen 3.5 seeria esimene avatud kaaludega mudel.
Põhiandmed
- Koguparameetrid: 397B
- Aktiivsed parameetrid: 17B per pass (hõre MoE)
- Läbilaskevõime: 8.6x-19x suurem kui Qwen 3-Max
- Maksumus: 60% madalam kui Qwen 3
- Keeletugi: 201 keelt (laiendatud 119-lt)
See ei ole lihtsalt parameetrite kuhjamine. See on tõhususe ümberdefineerimine.

Arhitektuuri uuendus
Qwen 3.5 kasutab hübriidarhitektuuri:
- Gated Delta Networks + hõre MoE
- Hübriidne lineaarne tähelepanu: enamik kihte kasutab lineaarset tähelepanu, iga 4 kihi järel kasutatakse täielikku tähelepanu
- Natiivne multimodality: ei ole hiljem lisatud, vaid on algusest peale treenitud
X-is on tehniline analüüs:
"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen
Selle arhitektuuri tähendus on: 17B aktiivsete parameetritega saavutatakse ligi 400B mudeli jõudlus. Järelduskulud on oluliselt vähenenud.
Jõudlusnõuded
Alibaba väidab, et Qwen 3.5 ületas:
- GPT-5.2
- Claude Opus 4.5
- Gemini 3 Pro
X-is alustavad sõltumatud testijad valideerimist:
"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme
Kuid kõige olulisem pole võrdlustestid, vaid agendi võimekus:
"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly
Agendi ajastu
Qwen 3.5 positsioon on selge: mõeldud agendi ajastuks.
- Saab analüüsida 2-tunnist videot
- Saab iseseisvalt täita rakendusteüleseid ülesandeid
- Saab aru GUI-st ja suhelda sellega
"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly
See tähendab, et see pole "juturobot", vaid "ülesannete täitja".
Konkurentsimaastik
X-is keegi võttis kokku selle nädala AI väljaanded:
"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek
Hiina mudelitootjate rütm on selge:
- DeepSeek V4
- Qwen 3.5
- GLM 5
- MiniMax 2.5
Igal nädalal on uus mudel ja iga kord väidetakse, et see ületab GPT. See pole turundus, see on kulude sõja eskaleerumine.
Kulustruktuur
Qwen 3.5 tokeni hind on ainult 1/18 Gemini 3 Pro omast.
"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob
Kui jõudlus on lähedane ja maksumus on ainult 5%, kus on suletud lähtekoodiga mudelite kaitsekraav?
Kokkuvõte
Qwen 3.5 ei ole "Hiina GPT". See on kulustruktuuri ümberpööraja:
- 397B parameetrit, kuid aktiveeritakse ainult 17B
- Avatud kaalud, saab kohapeal juurutada
- Agendi võimekus, mitte ainult dialoog
- Maksumus on ainult 5% konkurentide omast
X-is on huvitav ennustus:
"Qwen 3.5 Q4 版本只需要 225G,很有实用价值" — @janxin
225 GB videokaardi mälu, saab käivitada ühel masinal. See tähendab, et väikesed ja keskmise suurusega arendajad saavad esimest korda ligi GPT-5 tasemel mudelile.
Tegelik küsimus pole selles, kas Qwen 3.5 suudab GPT-5.3 ületada, vaid: kuidas AI ettevõtted raha teenivad, kui tipptasemel mudelite maksumus langeb peaaegu nullini?





