Qwen 3.5 kiadás: 397B paraméteres nyílt súlyú modell, 60%-kal alacsonyabb költséggel
Az Alibaba most adta ki a Qwen 3.5-397B-A17B-t. Ez a Qwen 3.5 sorozat első nyílt súlyú modellje.
Alapvető adatok
- Összes paraméter: 397B
- Aktív paraméterek: 17B per pass (ritka MoE)
- Átviteli sebesség: 8.6x-19x javulás a Qwen 3-Max-hoz képest
- Költség: 60%-kal alacsonyabb, mint a Qwen 3
- Nyelvi támogatás: 201 nyelv (119-ről bővítve)
Ez nem egyszerű paraméterhalmozás. Ez a hatékonyság újradefiniálása.

Architektúra innováció
A Qwen 3.5 hibrid architektúrát használ:
- Gated Delta Networks + ritka MoE
- Hibrid lineáris figyelem: a legtöbb réteg lineáris figyelmet használ, minden 4. réteg teljes figyelmet
- Natív többmódusú: nem utólagos hozzáadás, hanem a kezdetektől fogva betanítva
Az X-en van technikai elemzés:
"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen
Ennek az architektúrának a jelentősége: 17B aktív paraméterrel közel 400B modell teljesítményének elérése. A következtetési költség jelentősen csökken.
Teljesítmény állítások
Az Alibaba azt állítja, hogy a Qwen 3.5 legyőzte:
- GPT-5.2
- Claude Opus 4.5
- Gemini 3 Pro
Az X-en független tesztelők kezdték el ellenőrizni:
"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme
De a legfontosabb nem a benchmark teszt, hanem az ügynöki képesség:
"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly
Ügynökök kora
A Qwen 3.5 pozicionálása egyértelmű: az ügynökök korára tervezték.
- 2 órás videókat tud elemezni
- Önállóan tud alkalmazások közötti feladatokat végrehajtani
- Érti a GUI-t és interakcióba lép vele
"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly
Ez azt jelenti, hogy nem egy "chatbot", hanem egy "feladatvégrehajtó".
Versenytársak
Az X-en valaki összefoglalta a hét AI kiadásait:
"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek
A kínai modellgyártók üteme egyértelmű:
- DeepSeek V4
- Qwen 3.5
- GLM 5
- MiniMax 2.5
Hetente vannak új modellek, és mindegyik azt állítja, hogy legyőzi a GPT-t. Ez nem marketing, ez a költségháború eszkalációja.
Költségstruktúra
A Qwen 3.5 token ára csak 1/18-a a Gemini 3 Pro-nak.
"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob
Amikor a teljesítmény közel azonos, a költség pedig csak 5%, hol van a zárt forráskódú modellek védőárka?
Lényeg
A Qwen 3.5 nem egy "kínai GPT". Ez a költségstruktúra felforgatója:
- 397B paraméter, de csak 17B aktív
- Nyílt súlyok, helyben telepíthető
- Ügynöki képességek, nem csak párbeszéd
- A költség csak a versenytársak 5%-a
Az X-en van egy érdekes előrejelzés:
"Qwen 3.5 Q4 版本只需要 225G,很有实用价值" — @janxin
225GB VRAM, egy gépen futtatható. Ez azt jelenti, hogy a kis- és középvállalkozások fejlesztői először férhetnek hozzá a GPT-5 szintű modellekhez.
A valódi kérdés nem az, hogy a Qwen 3.5 le tudja-e győzni a GPT-5.3-at, hanem az: hogyan fognak pénzt keresni az AI cégek, amikor a csúcsmodellek költsége közel nulla?





