Qwen 3.5 izdan: Odprtokodni model s 397B parametri, 60% nižji stroški
Alibaba je pravkar izdala Qwen 3.5-397B-A17B. To je prvi odprtokodni model iz serije Qwen 3.5.
Ključni podatki
- Skupno število parametrov: 397B
- Aktivni parametri: 17B per pass (redka MoE)
- Prepustnost: 8.6x-19x izboljšava v primerjavi z Qwen 3-Max
- Stroški: 60% nižji v primerjavi z Qwen 3
- Podpora za jezike: 201 (razširjeno iz 119)
To ni preprosto kopičenje parametrov. To je redefinicija učinkovitosti.

Arhitekturne inovacije
Qwen 3.5 uporablja hibridno arhitekturo:
- Gated Delta Networks + redka MoE
- Hibridna linearna pozornost: večina plasti uporablja linearno pozornost, vsake 4 plasti uporabljajo polno pozornost
- Izvirna multimodalnost: ni dodana naknadno, ampak je trenirana od začetka
Na X-u je tehnična analiza:
"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen
Pomen te arhitekture je: z 17B aktivnimi parametri doseči zmogljivost, ki je blizu modelu s 400B parametri. Stroški sklepanja so se močno znižali.
Trditve o zmogljivosti
Alibaba trdi, da Qwen 3.5 premaga:
- GPT-5.2
- Claude Opus 4.5
- Gemini 3 Pro
Neodvisni preizkuševalci na X-u so začeli preverjati:
"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme
Vendar pa niso ključni merilni testi, ampak zmožnost agenta:
"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly
Doba agentov
Pozicioniranje Qwen 3.5 je jasno: zasnovan za dobo agentov.
- Lahko analizira 2 uri videoposnetkov
- Lahko samostojno izvaja naloge med aplikacijami
- Lahko razume GUI in komunicira z njim
"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly
To pomeni, da ni "chatbot", ampak "izvajalec nalog".
Konkurenčno okolje
Nekdo je na X-u povzel AI izdaje tega tedna:
"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek
Ritem kitajskih proizvajalcev modelov je jasen:
- DeepSeek V4
- Qwen 3.5
- GLM 5
- MiniMax 2.5
Vsak teden je na voljo nov model, vsakič pa trdijo, da premagajo GPT. To ni trženje, to je nadgradnja stroškovne vojne.
Stroškovna struktura
Cena tokenov Qwen 3.5 je samo 1/18 cene Gemini 3 Pro.
"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob
Ko je zmogljivost primerljiva, stroški pa samo 5%, kje je obrambni jarek zaprtih modelov?
Bistvo
Qwen 3.5 ni "kitajski GPT". Je rušilec stroškovne strukture:
- 397B parametrov, vendar aktivira samo 17B
- Odprtokodna utež, ki jo je mogoče lokalno namestiti
- Zmožnost agenta, ne samo pogovor
- Stroški so samo 5% stroškov konkurence
Na X-u je zanimiva napoved:
"Qwen 3.5 Q4 版本只需要 225G,很有实用价值" — @janxin
225 GB pomnilnika GPU, lahko se izvaja na enem računalniku. To pomeni, da lahko mala in srednje velika podjetja prvič dostopajo do modela, ki je blizu GPT-5.
Pravo vprašanje ni, ali lahko Qwen 3.5 premaga GPT-5.3, ampak: kako bodo podjetja za umetno inteligenco zaslužila, ko se stroški vrhunskih modelov znižajo na skoraj nič?





