Qwen 3.5 Objavljen: Model otvorenih težina sa 397B parametara, 60% niži troškovi
Alibaba je upravo objavila Qwen 3.5-397B-A17B. Ovo je prvi model otvorenih težina iz serije Qwen 3.5.
Ključni podaci
- Ukupni parametri: 397B
- Aktivni parametri: 17B po prolazu (rijetki MoE)
- Protok: 8.6x-19x veći od Qwen 3-Max
- Trošak: 60% niži od Qwen 3
- Podrška za jezike: 201 (prošireno sa 119)
Ovo nije jednostavno gomilanje parametara. Ovo je redefinicija efikasnosti.

Arhitektonske inovacije
Qwen 3.5 koristi hibridnu arhitekturu:
- Gated Delta Networks + rijetki MoE
- Hibridna linearna pažnja: Većina slojeva koristi linearnu pažnju, svaki 4. sloj koristi punu pažnju
- Izvorna multimodalnost: Nije dodana naknadno, već je trenirana od početka
Na X-u postoji tehnička analiza:
"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen
Značaj ove arhitekture je: postići performanse modela od skoro 400B sa 17B aktivnih parametara. Troškovi zaključivanja su značajno smanjeni.
Tvrdnje o performansama
Alibaba tvrdi da je Qwen 3.5 pobijedio:
- GPT-5.2
- Claude Opus 4.5
- Gemini 3 Pro
Nezavisni testeri na X-u su počeli da verifikuju:
"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme
Ali najvažnije nisu benchmark testovi, već agentske sposobnosti:
"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly
Era agenata
Pozicioniranje Qwen 3.5 je jasno: dizajniran za eru agenata.
- Može analizirati 2 sata videa
- Može samostalno izvršavati zadatke u različitim aplikacijama
- Može razumjeti GUI i komunicirati s njim
"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly
To znači da to nije „chatbot“, već „izvršitelj zadataka“.
Konkurentski pejzaž
Neko je na X-u sumirao AI objave ove sedmice:
"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek
Ritam kineskih proizvođača modela je jasan:
- DeepSeek V4
- Qwen 3.5
- GLM 5
- MiniMax 2.5
Svake sedmice se pojavljuju novi modeli, a svaki tvrdi da je pobijedio GPT. Ovo nije marketing, ovo je eskalacija ratova troškova.
Struktura troškova
Cijena tokena Qwen 3.5 je samo 1/18 cijene Gemini 3 Pro.
"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob
Kada su performanse slične, a troškovi samo 5%, gdje je opkop modela zatvorenog koda?
Zaključak
Qwen 3.5 nije „kineski GPT“. To je razarač strukture troškova:
- 397B parametara, ali samo 17B aktivirano
- Otvorene težine, mogu se lokalno implementirati
- Agentske sposobnosti, ne samo dijalog
- Troškovi su samo 5% konkurencije
Na X-u postoji zanimljiva prognoza:
"Qwen 3.5 Q4 版本只需要 225G,很有实用价值" — @janxin
225GB VRAM-a, može se pokrenuti na jednom računaru. To znači da mala i srednja preduzeća prvi put mogu pristupiti modelu blizu nivoa GPT-5.
Pravo pitanje nije da li Qwen 3.5 može pobijediti GPT-5.3, već: kako AI kompanije zarađuju kada se troškovi vrhunskih modela smanje na skoro nulu?





