Qwen 3.5 vydaný: Otvorený váhový model s 397B parametrami, náklady znížené o 60%

Spoločnosť Alibaba práve vydala Qwen 3.5-397B-A17B. Ide o prvý model s otvorenými váhami zo série Qwen 3.5.

Kľúčové údaje

Celkový počet parametrov: 397B
Aktívne parametre: 17B per pass (sparse MoE)
Priepustnosť: 8.6x-19x zlepšenie oproti Qwen 3-Max
Náklady: 60% zníženie oproti Qwen 3
Podpora jazykov: 201 (rozšírené zo 119)

Nejde len o jednoduché hromadenie parametrov. Je to redefinícia efektivity.

Qwen 3.5

Architektonické inovácie

Qwen 3.5 používa hybridnú architektúru:

Gated Delta Networks + sparse MoE
Hybridná lineárna pozornosť: Väčšina vrstiev používa lineárnu pozornosť, každá 4. vrstva používa plnú pozornosť
Natívna multimodálnosť: Nie je pridaná neskôr, ale trénovaná od začiatku

Na X (Twitter) je technická analýza:

"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen

Význam tejto architektúry spočíva v: dosiahnutí výkonu blízkeho 400B modelu s 17B aktívnymi parametrami. Náklady na inferenciu sa výrazne znižujú.

Tvrdenia o výkone

Spoločnosť Alibaba tvrdí, že Qwen 3.5 porazil:

GPT-5.2
Claude Opus 4.5
Gemini 3 Pro

Nezávislí testeri na X začali overovať:

"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme

Ale najdôležitejšie nie sú benchmarky, ale schopnosti agenta:

"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly

Éra agentov

Pozícia Qwen 3.5 je jasná: navrhnutý pre éru agentov.

Dokáže analyzovať 2-hodinové videá
Dokáže nezávisle vykonávať úlohy naprieč aplikáciami
Dokáže porozumieť GUI a interagovať s ním

"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly

To znamená, že to nie je „chatbot“, ale „vykonávateľ úloh“.

Konkurenčné prostredie

Niekto na X zhrnul tohtotýždňové vydania AI:

"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek

Rytmus čínskych výrobcov modelov je jasný:

DeepSeek V4
Qwen 3.5
GLM 5
MiniMax 2.5

Každý týždeň je tu nový model a každý tvrdí, že porazil GPT. Toto nie je marketing, toto je eskalácia nákladovej vojny.

Nákladová štruktúra

Cena tokenu Qwen 3.5 je len 1/18 ceny Gemini 3 Pro.

"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob

Keď je výkon porovnateľný a náklady sú len 5%, kde je priekopa uzavretých modelov?

Záver

Qwen 3.5 nie je „čínske GPT“. Je to narušiteľ nákladovej štruktúry:

397B parametrov, ale aktivuje sa len 17B
Otvorené váhy, nasaditeľné lokálne
Schopnosti agenta, nielen konverzácia
Náklady sú len 5% nákladov konkurencie

Na X je zaujímavá predpoveď:

"Qwen 3.5 Q4 版本只需要 225G，很有实用价值" — @janxin

225 GB VRAM, spustiteľné na jednom stroji. To znamená, že malí a strední vývojári sa prvýkrát dostanú k modelu, ktorý sa blíži úrovni GPT-5.

Skutočná otázka nie je, či Qwen 3.5 dokáže poraziť GPT-5.3, ale: ako budú spoločnosti zaoberajúce sa AI zarábať peniaze, keď náklady na špičkové modely klesnú takmer na nulu?

Qwen 3.5 vydaný: Otvorený váhový model s 397B parametrami, náklady znížené o 60%

Kľúčové údaje

Architektonické inovácie

Tvrdenia o výkone

Éra agentov

Konkurenčné prostredie

Nákladová štruktúra

Záver

You Might Also Like

Ako používať technológiu cloud computingu: Kompletný sprievodca na vytvorenie vašej prvej cloudovej infraštruktúry

Varovanie! Otec Claude Code priamo hovorí: O mesiac už nebudeme potrebovať Plan Mode, titul softvérového inžiniera zmizne

2026 Top 10 odporúčaní na zdroje hlbokého učenia

2026 Top 10 AI agenti: Analýza kľúčových predností

2026 Top 10 odporúčaných AI nástrojov: Uvoľnenie skutočného potenciálu umelej inteligencie

2026 Top 10 odporúčaných nástrojov a zdrojov AWS