Qwen 3.5 vydán: Model s otevřenou váhou a 397B parametry, náklady sníženy o 60 %
Alibaba právě vydala Qwen 3.5-397B-A17B. Jedná se o první model s otevřenou váhou ze série Qwen 3.5.
Klíčová data
- Celkový počet parametrů: 397B
- Aktivní parametry: 17B per pass (řídké MoE)
- Propustnost: 8.6x-19x vyšší než Qwen 3-Max
- Náklady: o 60 % nižší než Qwen 3
- Podpora jazyků: 201 (rozšířeno ze 119)
Nejde jen o jednoduché skládání parametrů. Je to redefinice efektivity.

Architektonické inovace
Qwen 3.5 používá hybridní architekturu:
- Gated Delta Networks + řídké MoE
- Hybridní lineární pozornost: většina vrstev používá lineární pozornost, každá 4. vrstva používá plnou pozornost
- Nativní multimodálnost: není přidána dodatečně, ale trénována od začátku
Na X (Twitter) je technická analýza:
"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen
Význam této architektury spočívá v: dosažení výkonu modelu s téměř 400B parametry s 17B aktivními parametry. Náklady na inferenci se výrazně snižují.
Prohlášení o výkonu
Alibaba tvrdí, že Qwen 3.5 porazil:
- GPT-5.2
- Claude Opus 4.5
- Gemini 3 Pro
Nezávislí testeři na X začali ověřovat:
"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme
Ale nejdůležitější nejsou benchmarky, ale schopnosti agenta:
"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly
Éra agentů
Pozice Qwen 3.5 je jasná: navrženo pro éru agentů.
- Dokáže analyzovat 2 hodiny videa
- Dokáže samostatně provádět úlohy napříč aplikacemi
- Dokáže porozumět GUI a interagovat s ním
"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly
To znamená, že to není „chatbot“, ale „vykonavatel úkolů“.
Konkurenční prostředí
Někdo na X shrnul AI vydání tohoto týdne:
"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek
Rytmus čínských výrobců modelů je jasný:
- DeepSeek V4
- Qwen 3.5
- GLM 5
- MiniMax 2.5
Každý týden je tu nový model a každý tvrdí, že porazil GPT. Není to marketing, je to eskalace nákladové války.
Nákladová struktura
Cena tokenu Qwen 3.5 je pouze 1/18 ceny Gemini 3 Pro.
"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob
Když je výkon srovnatelný a náklady jsou pouze 5 %, kde je hradba uzavřených modelů?
Závěr
Qwen 3.5 není „čínský GPT“. Je to narušitel nákladové struktury:
- 397B parametrů, ale aktivuje se pouze 17B
- Otevřená váha, lze nasadit lokálně
- Schopnosti agenta, nejen konverzace
- Náklady jsou pouze 5 % nákladů konkurence
Na X je zajímavá predikce:
"Qwen 3.5 Q4 版本只需要 225G,很有实用价值" — @janxin
225 GB VRAM, lze spustit na jednom stroji. To znamená, že malí a střední vývojáři se poprvé mohou dostat k modelu, který se blíží úrovni GPT-5.
Skutečná otázka není, zda Qwen 3.5 dokáže porazit GPT-5.3, ale: jak budou AI společnosti vydělávat peníze, když náklady na špičkové modely klesnou téměř k nule?





