Qwen 3.5 kiadás: 397B paraméteres nyílt súlyú modell, 60%-kal alacsonyabb költséggel

2/16/2026
3 min read

Az Alibaba most adta ki a Qwen 3.5-397B-A17B-t. Ez a Qwen 3.5 sorozat első nyílt súlyú modellje.

Alapvető adatok

  • Összes paraméter: 397B
  • Aktív paraméterek: 17B per pass (ritka MoE)
  • Átviteli sebesség: 8.6x-19x javulás a Qwen 3-Max-hoz képest
  • Költség: 60%-kal alacsonyabb, mint a Qwen 3
  • Nyelvi támogatás: 201 nyelv (119-ről bővítve)

Ez nem egyszerű paraméterhalmozás. Ez a hatékonyság újradefiniálása.

Qwen 3.5

Architektúra innováció

A Qwen 3.5 hibrid architektúrát használ:

  • Gated Delta Networks + ritka MoE
  • Hibrid lineáris figyelem: a legtöbb réteg lineáris figyelmet használ, minden 4. réteg teljes figyelmet
  • Natív többmódusú: nem utólagos hozzáadás, hanem a kezdetektől fogva betanítva

Az X-en van technikai elemzés:

"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen

Ennek az architektúrának a jelentősége: 17B aktív paraméterrel közel 400B modell teljesítményének elérése. A következtetési költség jelentősen csökken.

Teljesítmény állítások

Az Alibaba azt állítja, hogy a Qwen 3.5 legyőzte:

  • GPT-5.2
  • Claude Opus 4.5
  • Gemini 3 Pro

Az X-en független tesztelők kezdték el ellenőrizni:

"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme

De a legfontosabb nem a benchmark teszt, hanem az ügynöki képesség:

"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly

Ügynökök kora

A Qwen 3.5 pozicionálása egyértelmű: az ügynökök korára tervezték.

  • 2 órás videókat tud elemezni
  • Önállóan tud alkalmazások közötti feladatokat végrehajtani
  • Érti a GUI-t és interakcióba lép vele

"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly

Ez azt jelenti, hogy nem egy "chatbot", hanem egy "feladatvégrehajtó".

Versenytársak

Az X-en valaki összefoglalta a hét AI kiadásait:

"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek

A kínai modellgyártók üteme egyértelmű:

  • DeepSeek V4
  • Qwen 3.5
  • GLM 5
  • MiniMax 2.5

Hetente vannak új modellek, és mindegyik azt állítja, hogy legyőzi a GPT-t. Ez nem marketing, ez a költségháború eszkalációja.

Költségstruktúra

A Qwen 3.5 token ára csak 1/18-a a Gemini 3 Pro-nak.

"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob

Amikor a teljesítmény közel azonos, a költség pedig csak 5%, hol van a zárt forráskódú modellek védőárka?

Lényeg

A Qwen 3.5 nem egy "kínai GPT". Ez a költségstruktúra felforgatója:

  1. 397B paraméter, de csak 17B aktív
  2. Nyílt súlyok, helyben telepíthető
  3. Ügynöki képességek, nem csak párbeszéd
  4. A költség csak a versenytársak 5%-a

Az X-en van egy érdekes előrejelzés:

"Qwen 3.5 Q4 版本只需要 225G,很有实用价值" — @janxin

225GB VRAM, egy gépen futtatható. Ez azt jelenti, hogy a kis- és középvállalkozások fejlesztői először férhetnek hozzá a GPT-5 szintű modellekhez.

A valódi kérdés nem az, hogy a Qwen 3.5 le tudja-e győzni a GPT-5.3-at, hanem az: hogyan fognak pénzt keresni az AI cégek, amikor a csúcsmodellek költsége közel nulla?

Published in Technology

You Might Also Like