Qwen 3.5 izdan: Odprtokodni model s 397B parametri, 60% nižji stroški

2/16/2026
3 min read

Alibaba je pravkar izdala Qwen 3.5-397B-A17B. To je prvi odprtokodni model iz serije Qwen 3.5.

Ključni podatki

  • Skupno število parametrov: 397B
  • Aktivni parametri: 17B per pass (redka MoE)
  • Prepustnost: 8.6x-19x izboljšava v primerjavi z Qwen 3-Max
  • Stroški: 60% nižji v primerjavi z Qwen 3
  • Podpora za jezike: 201 (razširjeno iz 119)

To ni preprosto kopičenje parametrov. To je redefinicija učinkovitosti.

Qwen 3.5

Arhitekturne inovacije

Qwen 3.5 uporablja hibridno arhitekturo:

  • Gated Delta Networks + redka MoE
  • Hibridna linearna pozornost: večina plasti uporablja linearno pozornost, vsake 4 plasti uporabljajo polno pozornost
  • Izvirna multimodalnost: ni dodana naknadno, ampak je trenirana od začetka

Na X-u je tehnična analiza:

"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen

Pomen te arhitekture je: z 17B aktivnimi parametri doseči zmogljivost, ki je blizu modelu s 400B parametri. Stroški sklepanja so se močno znižali.

Trditve o zmogljivosti

Alibaba trdi, da Qwen 3.5 premaga:

  • GPT-5.2
  • Claude Opus 4.5
  • Gemini 3 Pro

Neodvisni preizkuševalci na X-u so začeli preverjati:

"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme

Vendar pa niso ključni merilni testi, ampak zmožnost agenta:

"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly

Doba agentov

Pozicioniranje Qwen 3.5 je jasno: zasnovan za dobo agentov.

  • Lahko analizira 2 uri videoposnetkov
  • Lahko samostojno izvaja naloge med aplikacijami
  • Lahko razume GUI in komunicira z njim

"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly

To pomeni, da ni "chatbot", ampak "izvajalec nalog".

Konkurenčno okolje

Nekdo je na X-u povzel AI izdaje tega tedna:

"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek

Ritem kitajskih proizvajalcev modelov je jasen:

  • DeepSeek V4
  • Qwen 3.5
  • GLM 5
  • MiniMax 2.5

Vsak teden je na voljo nov model, vsakič pa trdijo, da premagajo GPT. To ni trženje, to je nadgradnja stroškovne vojne.

Stroškovna struktura

Cena tokenov Qwen 3.5 je samo 1/18 cene Gemini 3 Pro.

"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob

Ko je zmogljivost primerljiva, stroški pa samo 5%, kje je obrambni jarek zaprtih modelov?

Bistvo

Qwen 3.5 ni "kitajski GPT". Je rušilec stroškovne strukture:

  1. 397B parametrov, vendar aktivira samo 17B
  2. Odprtokodna utež, ki jo je mogoče lokalno namestiti
  3. Zmožnost agenta, ne samo pogovor
  4. Stroški so samo 5% stroškov konkurence

Na X-u je zanimiva napoved:

"Qwen 3.5 Q4 版本只需要 225G,很有实用价值" — @janxin

225 GB pomnilnika GPU, lahko se izvaja na enem računalniku. To pomeni, da lahko mala in srednje velika podjetja prvič dostopajo do modela, ki je blizu GPT-5.

Pravo vprašanje ni, ali lahko Qwen 3.5 premaga GPT-5.3, ampak: kako bodo podjetja za umetno inteligenco zaslužila, ko se stroški vrhunskih modelov znižajo na skoraj nič?

Published in Technology

You Might Also Like