Qwen 3.5 avaldamine: 397B parameetriga avatud kaaludega mudel, kulud 60% madalamad

Alibaba avaldas just Qwen 3.5-397B-A17B. See on Qwen 3.5 seeria esimene avatud kaaludega mudel.

Põhiandmed

Koguparameetrid: 397B
Aktiivsed parameetrid: 17B per pass (hõre MoE)
Läbilaskevõime: 8.6x-19x suurem kui Qwen 3-Max
Maksumus: 60% madalam kui Qwen 3
Keeletugi: 201 keelt (laiendatud 119-lt)

See ei ole lihtsalt parameetrite kuhjamine. See on tõhususe ümberdefineerimine.

Qwen 3.5

Arhitektuuri uuendus

Qwen 3.5 kasutab hübriidarhitektuuri:

Gated Delta Networks + hõre MoE
Hübriidne lineaarne tähelepanu: enamik kihte kasutab lineaarset tähelepanu, iga 4 kihi järel kasutatakse täielikku tähelepanu
Natiivne multimodality: ei ole hiljem lisatud, vaid on algusest peale treenitud

X-is on tehniline analüüs:

"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen

Selle arhitektuuri tähendus on: 17B aktiivsete parameetritega saavutatakse ligi 400B mudeli jõudlus. Järelduskulud on oluliselt vähenenud.

Jõudlusnõuded

Alibaba väidab, et Qwen 3.5 ületas:

GPT-5.2
Claude Opus 4.5
Gemini 3 Pro

X-is alustavad sõltumatud testijad valideerimist:

"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme

Kuid kõige olulisem pole võrdlustestid, vaid agendi võimekus:

"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly

Agendi ajastu

Qwen 3.5 positsioon on selge: mõeldud agendi ajastuks.

Saab analüüsida 2-tunnist videot
Saab iseseisvalt täita rakendusteüleseid ülesandeid
Saab aru GUI-st ja suhelda sellega

"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly

See tähendab, et see pole "juturobot", vaid "ülesannete täitja".

Konkurentsimaastik

X-is keegi võttis kokku selle nädala AI väljaanded:

"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek

Hiina mudelitootjate rütm on selge:

DeepSeek V4
Qwen 3.5
GLM 5
MiniMax 2.5

Igal nädalal on uus mudel ja iga kord väidetakse, et see ületab GPT. See pole turundus, see on kulude sõja eskaleerumine.

Kulustruktuur

Qwen 3.5 tokeni hind on ainult 1/18 Gemini 3 Pro omast.

"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob

Kui jõudlus on lähedane ja maksumus on ainult 5%, kus on suletud lähtekoodiga mudelite kaitsekraav?

Kokkuvõte

Qwen 3.5 ei ole "Hiina GPT". See on kulustruktuuri ümberpööraja:

397B parameetrit, kuid aktiveeritakse ainult 17B
Avatud kaalud, saab kohapeal juurutada
Agendi võimekus, mitte ainult dialoog
Maksumus on ainult 5% konkurentide omast

X-is on huvitav ennustus:

"Qwen 3.5 Q4 版本只需要 225G，很有实用价值" — @janxin

225 GB videokaardi mälu, saab käivitada ühel masinal. See tähendab, et väikesed ja keskmise suurusega arendajad saavad esimest korda ligi GPT-5 tasemel mudelile.

Tegelik küsimus pole selles, kas Qwen 3.5 suudab GPT-5.3 ületada, vaid: kuidas AI ettevõtted raha teenivad, kui tipptasemel mudelite maksumus langeb peaaegu nullini?

Qwen 3.5 avaldamine: 397B parameetriga avatud kaaludega mudel, kulud 60% madalamad

Põhiandmed

Arhitektuuri uuendus

Jõudlusnõuded

Agendi ajastu

Konkurentsimaastik

Kulustruktuur

Kokkuvõte

You Might Also Like

Claude Code Buddy muutmise juhend: Kuidas saada sädelevat legendaarset lemmiklooma

Obsidian tutvustas Defuddle'i, viies Obsidian Web Clipperi uuele tasemele

OpenAI üllatavalt kuulutas välja "kolme ühes": brauser + programmeerimine + ChatGPT ühinemine, siseinfo tunnistab, et eelmisel aastal tehti valeotsuseid

2026, ära sunni end "distsipliini"! Tee need 8 väikest asja, tervis tuleb loomulikult

Need emad, kes püüavad kaalust alla võtta, kuid ei saa seda teha, on kindlasti siin kinni jäänud

AI Brauser 24 tunni stabiilse töö juhend