Qwen 3.5 izlaide: 397B parametru atvērtā svara modelis, izmaksas samazinātas par 60%

Alibaba tikko izlaida Qwen 3.5-397B-A17B. Šis ir pirmais atvērtā svara modelis no Qwen 3.5 sērijas.

Galvenie dati

Kopējie parametri: 397B
Aktīvie parametri: 17B per pass (sparse MoE)
Izlaide: 8.6x-19x uzlabojums salīdzinājumā ar Qwen 3-Max
Izmaksas: 60% samazinājums salīdzinājumā ar Qwen 3
Valodu atbalsts: 201 (paplašināts no 119)

Šī nav vienkārša parametru sakraušana. Šī ir efektivitātes no jauna definēšana.

Qwen 3.5

Arhitektūras inovācijas

Qwen 3.5 izmanto hibrīdarhitektūru:

Gated Delta Networks + sparse MoE
Hibrīda lineārā uzmanība: lielākā daļa slāņu izmanto lineāro uzmanību, katrs 4. slānis izmanto pilnu uzmanību
Dabīgais multimodālais: nav pievienots vēlāk, bet apmācīts no paša sākuma

X ir pieejama tehniskā analīze:

"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen

Šīs arhitektūras nozīme ir: ar 17B aktīviem parametriem panākt veiktspēju, kas ir tuvu 400B modelim. Secinājumu izmaksas ir ievērojami samazinātas.

Veiktspējas apgalvojumi

Alibaba apgalvo, ka Qwen 3.5 pārspēj:

GPT-5.2
Claude Opus 4.5
Gemini 3 Pro

X neatkarīgi testētāji sāk pārbaudīt:

"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme

Bet vissvarīgākais nav etaloni, bet gan aģenta spējas:

"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly

Aģentu laikmets

Qwen 3.5 pozicionēšana ir skaidra: izstrādāts aģentu laikmetam.

Var analizēt 2 stundu video
Var patstāvīgi veikt uzdevumus starp lietotnēm
Var saprast GUI un mijiedarboties ar to

"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly

Tas nozīmē, ka tas nav "tērzēšanas robots", bet gan "uzdevumu izpildītājs".

Konkurences ainava

X kāds apkopoja šīs nedēļas AI izlaidumus:

"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek

Ķīnas modeļu ražotāju ritms ir skaidrs:

DeepSeek V4
Qwen 3.5
GLM 5
MiniMax 2.5

Katru nedēļu ir jauns modelis, un katrs apgalvo, ka pārspēj GPT. Tā nav mārketinga, tas ir izmaksas kara eskalācija.

Izmaksu struktūra

Qwen 3.5 tokenu cena ir tikai 1/18 no Gemini 3 Pro cenas.

"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob

Kad veiktspēja ir tuvu un izmaksas ir tikai 5%, kur ir slēgto avotu modeļu aizsarggrāvis?

Apakšējā līnija

Qwen 3.5 nav "Ķīnas GPT". Tas ir izmaksas struktūras grautējs:

397B parametri, bet aktivizē tikai 17B
Atvērtie svari, var izvietot lokāli
Aģenta spējas, ne tikai dialogs
Izmaksas ir tikai 5% no konkurentu izmaksām

X ir interesanta prognoze:

"Qwen 3.5 Q4 版本只需要 225G，很有实用价值" — @janxin

225 GB atmiņas, var palaist vienā datorā. Tas nozīmē, ka mazie un vidējie izstrādātāji pirmo reizi var piekļūt modeļiem, kas ir tuvu GPT-5 līmenim.

Patiesais jautājums nav par to, vai Qwen 3.5 var pārspēt GPT-5.3, bet gan: kā AI uzņēmumi pelna naudu, kad augstākā līmeņa modeļu izmaksas tiek samazinātas līdz gandrīz nullei?

Qwen 3.5 izlaide: 397B parametru atvērtā svara modelis, izmaksas samazinātas par 60%

Galvenie dati

Arhitektūras inovācijas

Veiktspējas apgalvojumi

Aģentu laikmets

Konkurences ainava

Izmaksu struktūra

Apakšējā līnija

You Might Also Like

Claude Code Buddy modificēšanas ceļvedis: kā iegūt spīdīgu leģendāro mājdzīvnieku

Obsidian ir izlaidusi Defuddle, pacelot Obsidian Web Clipper uz jauniem augstumiem

OpenAI pēkšņi paziņo par "trīs vienā": pārlūks + programmēšana + ChatGPT apvienošana, iekšēji atzīst, ka pagājušajā gadā tika pieļautas kļūdas

2026, vairs neuzspied sevi "pašdisciplīnai"! Veic šos 8 sīkumus, veselība nāks dabiski

Māmiņas, kas cenšas zaudēt svaru, bet nesasniedz rezultātus, noteikti ir šeit

AI Pārlūka 24 stundu stabilas darbības ceļvedis