Qwen 3.5 julkaistu: 397B parametrin avoimen painon malli, kustannukset 60% alhaisemmat
Alibaba on juuri julkaissut Qwen 3.5-397B-A17B:n. Tämä on Qwen 3.5 -sarjan ensimmäinen avoimen painon malli.
Keskeiset tiedot
- Kokonaismäärä parametreja: 397B
- Aktiiviset parametrit: 17B per pass (harva MoE)
- Suorituskyky: 8.6x-19x parempi kuin Qwen 3-Max
- Kustannukset: 60% alhaisemmat kuin Qwen 3
- Kielituki: 201 kieltä (laajennettu 119 kielestä)
Tämä ei ole pelkkää parametrien pinoamista. Tämä on tehokkuuden uudelleenmäärittely.

Arkkitehtuurin innovaatiot
Qwen 3.5 käyttää hybridiarkkitehtuuria:
- Gated Delta Networks + harva MoE
- Hybridi lineaarinen huomio: Suurin osa kerroksista käyttää lineaarista huomiota, joka neljäs kerros käyttää täyttä huomiota
- Natiivi multimodaalisuus: Ei lisätty jälkikäteen, vaan koulutettu alusta alkaen
X:ssä on tekninen analyysi:
"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen
Tämän arkkitehtuurin merkitys on: 17B aktiivisen parametrin avulla saavutetaan lähes 400B mallin suorituskyky. Päättelykustannukset laskevat merkittävästi.
Suorituskykyväitteet
Alibaba väittää, että Qwen 3.5 päihittää:
- GPT-5.2
- Claude Opus 4.5
- Gemini 3 Pro
X:ssä riippumattomat testaajat ovat alkaneet vahvistaa:
"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme
Mutta tärkeintä ei ole suorituskykytestit, vaan agenttitoiminnot:
"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly
Agenttiaika
Qwen 3.5:n asema on selvä: suunniteltu agenttiaikaa varten.
- Voi analysoida 2 tunnin videoita
- Voi itsenäisesti suorittaa sovellusten välisiä tehtäviä
- Voi ymmärtää GUI:ta ja olla vuorovaikutuksessa sen kanssa
"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly
Tämä tarkoittaa, että se ei ole "chatbot", vaan "tehtävien suorittaja".
Kilpailutilanne
X:ssä joku tiivisti tämän viikon AI-julkaisut:
"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek
Kiinalaisten mallivalmistajien tahti on selvä:
- DeepSeek V4
- Qwen 3.5
- GLM 5
- MiniMax 2.5
Joka viikko on uusi malli, ja jokainen väittää päihittävänsä GPT:n. Tämä ei ole markkinointia, tämä on kustannussodan kiihtymistä.
Kustannusrakenne
Qwen 3.5:n token-hinta on vain 1/18 Gemini 3 Pron hinnasta.
"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob
Kun suorituskyky on lähellä ja kustannukset vain 5%, missä on suljetun lähdekoodin mallien suojavalli?
Lopputulos
Qwen 3.5 ei ole "Kiinan GPT". Se on kustannusrakenteen mullistaja:
- 397B parametria, mutta vain 17B aktivoituu
- Avoin paino, voidaan asentaa paikallisesti
- Agenttitoiminnot, ei vain keskustelua
- Kustannukset vain 5% kilpailijoista
X:ssä on mielenkiintoinen ennustus:
"Qwen 3.5 Q4 版本只需要 225G,很有实用价值" — @janxin
225GB näytönohjainmuistia, voidaan ajaa yhdellä koneella. Tämä tarkoittaa, että pienet ja keskisuuret kehittäjät voivat ensimmäistä kertaa päästä käsiksi lähes GPT-5-tasoisen mallin.
Varsinainen kysymys ei ole, voiko Qwen 3.5 päihittää GPT-5.3:n, vaan: miten AI-yritykset tienaavat rahaa, kun huippumallien kustannukset laskevat lähes nollaan?





