Qwen 3.5 julkaistu: 397B parametrin avoimen painon malli, kustannukset 60% alhaisemmat

2/16/2026
3 min read

Alibaba on juuri julkaissut Qwen 3.5-397B-A17B:n. Tämä on Qwen 3.5 -sarjan ensimmäinen avoimen painon malli.

Keskeiset tiedot

  • Kokonaismäärä parametreja: 397B
  • Aktiiviset parametrit: 17B per pass (harva MoE)
  • Suorituskyky: 8.6x-19x parempi kuin Qwen 3-Max
  • Kustannukset: 60% alhaisemmat kuin Qwen 3
  • Kielituki: 201 kieltä (laajennettu 119 kielestä)

Tämä ei ole pelkkää parametrien pinoamista. Tämä on tehokkuuden uudelleenmäärittely.

Qwen 3.5

Arkkitehtuurin innovaatiot

Qwen 3.5 käyttää hybridiarkkitehtuuria:

  • Gated Delta Networks + harva MoE
  • Hybridi lineaarinen huomio: Suurin osa kerroksista käyttää lineaarista huomiota, joka neljäs kerros käyttää täyttä huomiota
  • Natiivi multimodaalisuus: Ei lisätty jälkikäteen, vaan koulutettu alusta alkaen

X:ssä on tekninen analyysi:

"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen

Tämän arkkitehtuurin merkitys on: 17B aktiivisen parametrin avulla saavutetaan lähes 400B mallin suorituskyky. Päättelykustannukset laskevat merkittävästi.

Suorituskykyväitteet

Alibaba väittää, että Qwen 3.5 päihittää:

  • GPT-5.2
  • Claude Opus 4.5
  • Gemini 3 Pro

X:ssä riippumattomat testaajat ovat alkaneet vahvistaa:

"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme

Mutta tärkeintä ei ole suorituskykytestit, vaan agenttitoiminnot:

"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly

Agenttiaika

Qwen 3.5:n asema on selvä: suunniteltu agenttiaikaa varten.

  • Voi analysoida 2 tunnin videoita
  • Voi itsenäisesti suorittaa sovellusten välisiä tehtäviä
  • Voi ymmärtää GUI:ta ja olla vuorovaikutuksessa sen kanssa

"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly

Tämä tarkoittaa, että se ei ole "chatbot", vaan "tehtävien suorittaja".

Kilpailutilanne

X:ssä joku tiivisti tämän viikon AI-julkaisut:

"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek

Kiinalaisten mallivalmistajien tahti on selvä:

  • DeepSeek V4
  • Qwen 3.5
  • GLM 5
  • MiniMax 2.5

Joka viikko on uusi malli, ja jokainen väittää päihittävänsä GPT:n. Tämä ei ole markkinointia, tämä on kustannussodan kiihtymistä.

Kustannusrakenne

Qwen 3.5:n token-hinta on vain 1/18 Gemini 3 Pron hinnasta.

"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob

Kun suorituskyky on lähellä ja kustannukset vain 5%, missä on suljetun lähdekoodin mallien suojavalli?

Lopputulos

Qwen 3.5 ei ole "Kiinan GPT". Se on kustannusrakenteen mullistaja:

  1. 397B parametria, mutta vain 17B aktivoituu
  2. Avoin paino, voidaan asentaa paikallisesti
  3. Agenttitoiminnot, ei vain keskustelua
  4. Kustannukset vain 5% kilpailijoista

X:ssä on mielenkiintoinen ennustus:

"Qwen 3.5 Q4 版本只需要 225G,很有实用价值" — @janxin

225GB näytönohjainmuistia, voidaan ajaa yhdellä koneella. Tämä tarkoittaa, että pienet ja keskisuuret kehittäjät voivat ensimmäistä kertaa päästä käsiksi lähes GPT-5-tasoisen mallin.

Varsinainen kysymys ei ole, voiko Qwen 3.5 päihittää GPT-5.3:n, vaan: miten AI-yritykset tienaavat rahaa, kun huippumallien kustannukset laskevat lähes nollaan?

Published in Technology

You Might Also Like

Kuinka käyttää pilvilaskentateknologiaa: Rakenna ensimmäinen pilvi-infrastruktuurisi täydellinen opasTechnology

Kuinka käyttää pilvilaskentateknologiaa: Rakenna ensimmäinen pilvi-infrastruktuurisi täydellinen opas

[[HTMLPLACEHOLDER0]] [[HTMLPLACEHOLDER1]] [[HTMLPLACEHOLDER2]] [[HTMLPLACEHOLDER3]] [[HTMLPLACEHOLDER4]] [[HTMLPLACEHOLD...

Varoitus! Claude Code isänsä Boris Cherny sanoo: Kuukauden kuluttua Plan Modea ei enää käytetä, ohjelmistosuunnittelijan titteli katoaaTechnology

Varoitus! Claude Code isänsä Boris Cherny sanoo: Kuukauden kuluttua Plan Modea ei enää käytetä, ohjelmistosuunnittelijan titteli katoaa

Varoitus! Claude Code isänsä Boris Cherny sanoo: Kuukauden kuluttua Plan Modea ei enää käytetä, ohjelmistosuunnittelijan...

2026年 Top 10 深度学习资源推荐Technology

2026年 Top 10 深度学习资源推荐

2026年 Top 10 深度学习资源推荐 随着深度学习在各个领域的迅速发展,越来越多的学习资源和工具涌现出来。本文将为您推荐2026年最值得关注的十个深度学习资源,帮助您在这一领域中快速成长。 1. Coursera Deep Learn...

2026 Top 10 AI Agentit: Ydinmyyntipisteiden analyysiTechnology

2026 Top 10 AI Agentit: Ydinmyyntipisteiden analyysi

2026 Top 10 AI Agentit: Ydinmyyntipisteiden analyysi Johdanto Nopean tekoälyn kehityksen myötä AI agentit ovat nousseet ...

2026 vuoden Top 10 AI-työkalusuositukset: Vapauta tekoälyn todellinen potentiaaliTechnology

2026 vuoden Top 10 AI-työkalusuositukset: Vapauta tekoälyn todellinen potentiaali

2026 vuoden Top 10 AI-työkalusuositukset: Vapauta tekoälyn todellinen potentiaali Nykyään, kun teknologia kehittyy nopea...

2026年 Top 10 AWS工具和资源推荐Technology

2026年 Top 10 AWS工具和资源推荐

2026年 Top 10 AWS工具和资源推荐 在快速发展的云计算领域,Amazon Web Services (AWS) 一直是领军者,提供丰富的服务和工具,帮助开发者、企业和技术专家在云上有效工作。以下是2026年值得关注的十大AWS工...