Qwen 3.5 vydaný: Otvorený váhový model s 397B parametrami, náklady znížené o 60%

2/16/2026
3 min read

Spoločnosť Alibaba práve vydala Qwen 3.5-397B-A17B. Ide o prvý model s otvorenými váhami zo série Qwen 3.5.

Kľúčové údaje

  • Celkový počet parametrov: 397B
  • Aktívne parametre: 17B per pass (sparse MoE)
  • Priepustnosť: 8.6x-19x zlepšenie oproti Qwen 3-Max
  • Náklady: 60% zníženie oproti Qwen 3
  • Podpora jazykov: 201 (rozšírené zo 119)

Nejde len o jednoduché hromadenie parametrov. Je to redefinícia efektivity.

Qwen 3.5

Architektonické inovácie

Qwen 3.5 používa hybridnú architektúru:

  • Gated Delta Networks + sparse MoE
  • Hybridná lineárna pozornosť: Väčšina vrstiev používa lineárnu pozornosť, každá 4. vrstva používa plnú pozornosť
  • Natívna multimodálnosť: Nie je pridaná neskôr, ale trénovaná od začiatku

Na X (Twitter) je technická analýza:

"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen

Význam tejto architektúry spočíva v: dosiahnutí výkonu blízkeho 400B modelu s 17B aktívnymi parametrami. Náklady na inferenciu sa výrazne znižujú.

Tvrdenia o výkone

Spoločnosť Alibaba tvrdí, že Qwen 3.5 porazil:

  • GPT-5.2
  • Claude Opus 4.5
  • Gemini 3 Pro

Nezávislí testeri na X začali overovať:

"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme

Ale najdôležitejšie nie sú benchmarky, ale schopnosti agenta:

"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly

Éra agentov

Pozícia Qwen 3.5 je jasná: navrhnutý pre éru agentov.

  • Dokáže analyzovať 2-hodinové videá
  • Dokáže nezávisle vykonávať úlohy naprieč aplikáciami
  • Dokáže porozumieť GUI a interagovať s ním

"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly

To znamená, že to nie je „chatbot“, ale „vykonávateľ úloh“.

Konkurenčné prostredie

Niekto na X zhrnul tohtotýždňové vydania AI:

"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek

Rytmus čínskych výrobcov modelov je jasný:

  • DeepSeek V4
  • Qwen 3.5
  • GLM 5
  • MiniMax 2.5

Každý týždeň je tu nový model a každý tvrdí, že porazil GPT. Toto nie je marketing, toto je eskalácia nákladovej vojny.

Nákladová štruktúra

Cena tokenu Qwen 3.5 je len 1/18 ceny Gemini 3 Pro.

"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob

Keď je výkon porovnateľný a náklady sú len 5%, kde je priekopa uzavretých modelov?

Záver

Qwen 3.5 nie je „čínske GPT“. Je to narušiteľ nákladovej štruktúry:

  1. 397B parametrov, ale aktivuje sa len 17B
  2. Otvorené váhy, nasaditeľné lokálne
  3. Schopnosti agenta, nielen konverzácia
  4. Náklady sú len 5% nákladov konkurencie

Na X je zaujímavá predpoveď:

"Qwen 3.5 Q4 版本只需要 225G,很有实用价值" — @janxin

225 GB VRAM, spustiteľné na jednom stroji. To znamená, že malí a strední vývojári sa prvýkrát dostanú k modelu, ktorý sa blíži úrovni GPT-5.

Skutočná otázka nie je, či Qwen 3.5 dokáže poraziť GPT-5.3, ale: ako budú spoločnosti zaoberajúce sa AI zarábať peniaze, keď náklady na špičkové modely klesnú takmer na nulu?

Published in Technology

You Might Also Like