Qwen 3.5 izdan: Odprtokodni model s 397B parametri, 60% nižji stroški

Alibaba je pravkar izdala Qwen 3.5-397B-A17B. To je prvi odprtokodni model iz serije Qwen 3.5.

Ključni podatki

Skupno število parametrov: 397B
Aktivni parametri: 17B per pass (redka MoE)
Prepustnost: 8.6x-19x izboljšava v primerjavi z Qwen 3-Max
Stroški: 60% nižji v primerjavi z Qwen 3
Podpora za jezike: 201 (razširjeno iz 119)

To ni preprosto kopičenje parametrov. To je redefinicija učinkovitosti.

Qwen 3.5

Arhitekturne inovacije

Qwen 3.5 uporablja hibridno arhitekturo:

Gated Delta Networks + redka MoE
Hibridna linearna pozornost: večina plasti uporablja linearno pozornost, vsake 4 plasti uporabljajo polno pozornost
Izvirna multimodalnost: ni dodana naknadno, ampak je trenirana od začetka

Na X-u je tehnična analiza:

"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen

Pomen te arhitekture je: z 17B aktivnimi parametri doseči zmogljivost, ki je blizu modelu s 400B parametri. Stroški sklepanja so se močno znižali.

Trditve o zmogljivosti

Alibaba trdi, da Qwen 3.5 premaga:

GPT-5.2
Claude Opus 4.5
Gemini 3 Pro

Neodvisni preizkuševalci na X-u so začeli preverjati:

"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme

Vendar pa niso ključni merilni testi, ampak zmožnost agenta:

"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly

Doba agentov

Pozicioniranje Qwen 3.5 je jasno: zasnovan za dobo agentov.

Lahko analizira 2 uri videoposnetkov
Lahko samostojno izvaja naloge med aplikacijami
Lahko razume GUI in komunicira z njim

"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly

To pomeni, da ni "chatbot", ampak "izvajalec nalog".

Konkurenčno okolje

Nekdo je na X-u povzel AI izdaje tega tedna:

"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek

Ritem kitajskih proizvajalcev modelov je jasen:

DeepSeek V4
Qwen 3.5
GLM 5
MiniMax 2.5

Vsak teden je na voljo nov model, vsakič pa trdijo, da premagajo GPT. To ni trženje, to je nadgradnja stroškovne vojne.

Stroškovna struktura

Cena tokenov Qwen 3.5 je samo 1/18 cene Gemini 3 Pro.

"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob

Ko je zmogljivost primerljiva, stroški pa samo 5%, kje je obrambni jarek zaprtih modelov?

Bistvo

Qwen 3.5 ni "kitajski GPT". Je rušilec stroškovne strukture:

397B parametrov, vendar aktivira samo 17B
Odprtokodna utež, ki jo je mogoče lokalno namestiti
Zmožnost agenta, ne samo pogovor
Stroški so samo 5% stroškov konkurence

Na X-u je zanimiva napoved:

"Qwen 3.5 Q4 版本只需要 225G，很有实用价值" — @janxin

225 GB pomnilnika GPU, lahko se izvaja na enem računalniku. To pomeni, da lahko mala in srednje velika podjetja prvič dostopajo do modela, ki je blizu GPT-5.

Pravo vprašanje ni, ali lahko Qwen 3.5 premaga GPT-5.3, ampak: kako bodo podjetja za umetno inteligenco zaslužila, ko se stroški vrhunskih modelov znižajo na skoraj nič?

Qwen 3.5 izdan: Odprtokodni model s 397B parametri, 60% nižji stroški

Ključni podatki

Arhitekturne inovacije

Trditve o zmogljivosti

Doba agentov

Konkurenčno okolje

Stroškovna struktura

Bistvo

You Might Also Like

Claude Code Buddy 修改指南：如何获得闪光传说级宠物

Obsidian je predstavil Defuddle, ki je Obsidian Web Clipper dvignil na novo raven

OpenAI nenadoma napoveduje "tri v enem": združitev brskalnika + programiranja + ChatGPT, notranje priznanje, da so v preteklem letu zgrešili pot

2026, ne silite se več v 'discipliniranost'! Poskrbite za teh 8 malenkosti, zdravje bo prišlo naravno

Tiste mame, ki se trudijo shujšati, a jim ne uspe, so zagotovo tukaj naletele na težave

AI Browser 24-urna stabilna delovna navodila