Objavljen Qwen 3.5: Model otvorenih težina s 397B parametara, 60% niži troškovi

Alibaba je upravo objavila Qwen 3.5-397B-A17B. Ovo je prvi model otvorenih težina iz serije Qwen 3.5.

Ključni podaci

Ukupni parametri: 397B
Aktivni parametri: 17B po prolazu (rijetki MoE)
Protok: 8.6x-19x veći od Qwen 3-Max
Trošak: 60% niži od Qwen 3
Podrška za jezike: 201 (prošireno sa 119)

Ovo nije jednostavno gomilanje parametara. Ovo je redefiniranje učinkovitosti.

Arhitektonske inovacije

Qwen 3.5 koristi hibridnu arhitekturu:

Gated Delta Networks + rijetki MoE
Hibridna linearna pažnja: Većina slojeva koristi linearnu pažnju, a svaki 4. sloj koristi punu pažnju
Izvorna multimodalnost: Nije dodana naknadno, već je trenirana od početka

Na X-u postoji tehnička analiza:

"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen

Značenje ove arhitekture je: postići performanse modela od gotovo 400B s 17B aktivnih parametara. Troškovi zaključivanja su znatno smanjeni.

Tvrdnje o performansama

Alibaba tvrdi da je Qwen 3.5 pobijedio:

GPT-5.2
Claude Opus 4.5
Gemini 3 Pro

Neovisni testeri na X-u počinju provjeravati:

"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme

Ali najvažnije nisu benchmark testovi, već agentske sposobnosti:

"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly

Doba agenata

Pozicioniranje Qwen 3.5 je jasno: dizajniran za doba agenata.

Može analizirati 2 sata videa
Može samostalno izvršavati zadatke u različitim aplikacijama
Može razumjeti GUI i komunicirati s njim

"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly

To znači da nije "chatbot", već "izvršitelj zadataka".

Konkurentsko okruženje

Netko je na X-u sažeo AI objave ovog tjedna:

"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek

Ritam kineskih proizvođača modela je jasan:

DeepSeek V4
Qwen 3.5
GLM 5
MiniMax 2.5

Svaki tjedan postoji novi model, a svaki tvrdi da je pobijedio GPT. Ovo nije marketing, ovo je eskalacija ratova troškova.

Struktura troškova

Cijena tokena Qwen 3.5 je samo 1/18 cijene Gemini 3 Pro.

"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob

Kada su performanse blizu, a trošak samo 5%, gdje je opkop zatvorenih modela?

Zaključak

Qwen 3.5 nije "kineski GPT". On je razarač strukture troškova:

397B parametara, ali samo 17B aktivirano
Otvorene težine, mogu se lokalno implementirati
Agentske sposobnosti, ne samo dijalog
Trošak je samo 5% konkurencije

Na X-u postoji zanimljivo predviđanje:

"Qwen 3.5 Q4 版本只需要 225G，很有实用价值" — @janxin

225 GB VRAM-a, može se pokrenuti na jednom stroju. To znači da mali i srednji programeri prvi put mogu pristupiti modelu blizu razine GPT-5.

Pravo pitanje nije može li Qwen 3.5 pobijediti GPT-5.3, već: kako AI tvrtke zarađuju kada se trošak vrhunskih modela smanji na gotovo nulu?

Objavljen Qwen 3.5: Model otvorenih težina s 397B parametara, 60% niži troškovi

Ključni podaci

Arhitektonske inovacije

Tvrdnje o performansama

Doba agenata

Konkurentsko okruženje

Struktura troškova

Zaključak

You Might Also Like

Claude Code Buddy izmjena vodič: kako dobiti sjajnog legendarno ljubimca

Obsidian je lansirao Defuddle, podižući Obsidian Web Clipper na novu razinu

OpenAI iznenada najavljuje "tri u jednom": spajanje preglednika + programiranja + ChatGPT, unutarnje priznanje da su prošlu godinu pogriješili

2026, ne prisiljavajte se na "disciplinu"! Učinite ovih 8 malih stvari, zdravlje će doći prirodno

One effortful mothers who can't lose weight definitely fall here

AI Browser 24-satna stabilna operativna uputa