Qwen 3.5 vydán: Model s otevřenou váhou a 397B parametry, náklady sníženy o 60 %

Alibaba právě vydala Qwen 3.5-397B-A17B. Jedná se o první model s otevřenou váhou ze série Qwen 3.5.

Klíčová data

Celkový počet parametrů: 397B
Aktivní parametry: 17B per pass (řídké MoE)
Propustnost: 8.6x-19x vyšší než Qwen 3-Max
Náklady: o 60 % nižší než Qwen 3
Podpora jazyků: 201 (rozšířeno ze 119)

Nejde jen o jednoduché skládání parametrů. Je to redefinice efektivity.

Qwen 3.5

Architektonické inovace

Qwen 3.5 používá hybridní architekturu:

Gated Delta Networks + řídké MoE
Hybridní lineární pozornost: většina vrstev používá lineární pozornost, každá 4. vrstva používá plnou pozornost
Nativní multimodálnost: není přidána dodatečně, ale trénována od začátku

Na X (Twitter) je technická analýza:

"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen

Význam této architektury spočívá v: dosažení výkonu modelu s téměř 400B parametry s 17B aktivními parametry. Náklady na inferenci se výrazně snižují.

Prohlášení o výkonu

Alibaba tvrdí, že Qwen 3.5 porazil:

GPT-5.2
Claude Opus 4.5
Gemini 3 Pro

Nezávislí testeři na X začali ověřovat:

"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme

Ale nejdůležitější nejsou benchmarky, ale schopnosti agenta:

"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly

Éra agentů

Pozice Qwen 3.5 je jasná: navrženo pro éru agentů.

Dokáže analyzovat 2 hodiny videa
Dokáže samostatně provádět úlohy napříč aplikacemi
Dokáže porozumět GUI a interagovat s ním

"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly

To znamená, že to není „chatbot“, ale „vykonavatel úkolů“.

Konkurenční prostředí

Někdo na X shrnul AI vydání tohoto týdne:

"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek

Rytmus čínských výrobců modelů je jasný:

DeepSeek V4
Qwen 3.5
GLM 5
MiniMax 2.5

Každý týden je tu nový model a každý tvrdí, že porazil GPT. Není to marketing, je to eskalace nákladové války.

Nákladová struktura

Cena tokenu Qwen 3.5 je pouze 1/18 ceny Gemini 3 Pro.

"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob

Když je výkon srovnatelný a náklady jsou pouze 5 %, kde je hradba uzavřených modelů?

Závěr

Qwen 3.5 není „čínský GPT“. Je to narušitel nákladové struktury:

397B parametrů, ale aktivuje se pouze 17B
Otevřená váha, lze nasadit lokálně
Schopnosti agenta, nejen konverzace
Náklady jsou pouze 5 % nákladů konkurence

Na X je zajímavá predikce:

"Qwen 3.5 Q4 版本只需要 225G，很有实用价值" — @janxin

225 GB VRAM, lze spustit na jednom stroji. To znamená, že malí a střední vývojáři se poprvé mohou dostat k modelu, který se blíží úrovni GPT-5.

Skutečná otázka není, zda Qwen 3.5 dokáže porazit GPT-5.3, ale: jak budou AI společnosti vydělávat peníze, když náklady na špičkové modely klesnou téměř k nule?

Qwen 3.5 vydán: Model s otevřenou váhou a 397B parametry, náklady sníženy o 60 %

Klíčová data

Architektonické inovace

Prohlášení o výkonu

Éra agentů

Konkurenční prostředí

Nákladová struktura

Závěr

You Might Also Like

Claude Code Buddy úpravy: Jak získat lesklého legendárního mazlíčka

Obsidian uvedl Defuddle, který posunul Obsidian Web Clipper na novou úroveň

OpenAI náhle oznámila "třív jednom": sloučení prohlížeče + programování + ChatGPT, interně přiznává, že se v uplynulém roce mýlila

2026, už se nenuťte k "sebeovládání"! Udělejte těchto 8 drobností a zdraví přijde přirozeně

Ty matky, které se snaží zhubnout, ale nedaří se jim, se určitě potýkají s tímto problémem

AI Browser 24 hodinový stabilní provozní průvodce