Qwen 3.5 gefið út: Opinn þyngdarlíkan með 397B breytum, kostnaður lækkaður um 60%

Alibaba hefur nýlega gefið út Qwen 3.5-397B-A17B. Þetta er fyrsta opna þyngdarlíkanið í Qwen 3.5 seríunni.

Kjarnagögn

Heildarbreytur: 397B
Virkjaðar breytur: 17B per pass (sparse MoE)
Gegnumstreymi: 8.6x-19x betra en Qwen 3-Max
Kostnaður: 60% lægri en Qwen 3
Tungumálastuðningur: 201 (stækkað úr 119)

Þetta er ekki einföld stafla af breytum. Þetta er endurskilgreining á skilvirkni.

Qwen 3.5

Nýjungar í arkitektúr

Qwen 3.5 notar blendinga arkitektúr:

Gated Delta Networks + sparse MoE
Blendinga línuleg athygli: Flest lög nota línulega athygli, hvert 4. lag notar fulla athygli
Innbyggt fjölbreytileiki: Ekki bætt við seinna, heldur þjálfað frá grunni

Það er tæknileg greining á X:

"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen

Merking þessa arkitektúrs er: Að ná frammistöðu nálægt 400B líkani með 17B virkjum breytum. Ályktunarkostnaður lækkar verulega.

Frammistöðuyfirlýsingar

Alibaba fullyrðir að Qwen 3.5 hafi sigrað:

GPT-5.2
Claude Opus 4.5
Gemini 3 Pro

Óháðir prófarar á X eru byrjaðir að staðfesta:

"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme

En það mikilvægasta er ekki viðmiðunarprófanir, heldur umboðsgeta:

"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly

Umboðstíminn

Staðsetning Qwen 3.5 er mjög skýr: Hönnuð fyrir umboðstímann.

Getur greint 2ja tíma myndbönd
Getur sjálfstætt framkvæmt verkefni á milli forrita
Getur skilið GUI og átt samskipti við það

"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly

Þetta þýðir að það er ekki „spjallbotni“, heldur „verkefnaframkvæmdaraðili“.

Samkeppnislandslag

Einhver á X dró saman AI útgáfur þessarar viku:

"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek

Taktur kínverskra líkanaframleiðenda er mjög skýr:

DeepSeek V4
Qwen 3.5
GLM 5
MiniMax 2.5

Nýtt líkan í hverri viku, hvert og eitt fullyrðir að það sigri GPT. Þetta er ekki markaðssetning, þetta er uppfærsla á kostnaðarstríði.

Kostnaðarsamsetning

Token verð Qwen 3.5 er aðeins 1/18 af Gemini 3 Pro.

"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob

Þegar frammistaðan er svipuð og kostnaðurinn er aðeins 5%, hvar er varnargarður lokaðra líkana?

Niðurstaða

Qwen 3.5 er ekki „kínverskt GPT“. Það er truflun á kostnaðarsamsetningu:

397B breytur, en aðeins 17B virkjaðar
Opin þyngd, hægt að setja upp staðbundið
Umboðsgeta, ekki bara samtal
Kostnaður aðeins 5% af keppinautum

Það er áhugaverð spá á X:

"Qwen 3.5 Q4 版本只需要 225G，很有实用价值" — @janxin

225GB af minni, hægt að keyra á einni vél. Þetta þýðir að litlir og meðalstórir þróunaraðilar geta í fyrsta skipti fengið aðgang að líkani sem er nálægt GPT-5 stigi.

Raunverulega spurningin er ekki hvort Qwen 3.5 geti sigrað GPT-5.3, heldur: Hvernig græða AI fyrirtæki peninga þegar kostnaður við efstu líkön lækkar í næstum núll?

Qwen 3.5 gefið út: Opinn þyngdarlíkan með 397B breytum, kostnaður lækkaður um 60%

Kjarnagögn

Nýjungar í arkitektúr

Frammistöðuyfirlýsingar

Umboðstíminn

Samkeppnislandslag

Kostnaðarsamsetning

Niðurstaða

You Might Also Like

Claude Code Buddy breytingarleiðbeiningar: Hvernig á að fá glitrandi goðsagnir dýr

Obsidian hefur gefið út Defuddle, sem lyftir Obsidian Web Clipper á nýjan hæð

OpenAI tilkynnti skyndilega "þrjú í eitt": Vafri + forritun + ChatGPT sameining, innanhúss viðurkenndu þau að hafa farið rangt að síðasta árið

2026, ekki lengur að þrýsta á sjálfan sig "sjálfsaga"! Gerðu þessar 8 litlu hluti, heilsa kemur náttúrulega

Mæðurnar sem reyna að léttast en ná ekki árangri, eru örugglega að lenda í þessu

AI Browser 24 tíma stöðugleika leiðbeiningar