Qwen 3.5 išleistas: 397B parametrų atvirojo svorio modelis, 60% mažesnė kaina

Alibaba ką tik išleido Qwen 3.5-397B-A17B. Tai yra pirmasis Qwen 3.5 serijos atvirojo svorio modelis.

Pagrindiniai duomenys

Bendras parametrų skaičius: 397B
Aktyvūs parametrai: 17B per pass (retas MoE)
Pralaidumas: 8.6x-19x didesnis nei Qwen 3-Max
Kaina: 60% mažesnė nei Qwen 3
Kalbos palaikymas: 201 (išplėstas nuo 119)

Tai nėra paprastas parametrų sukrovimas. Tai yra efektyvumo apibrėžimas iš naujo.

Qwen 3.5

Architektūros inovacijos

Qwen 3.5 naudoja hibridinę architektūrą:

Gated Delta Networks + retas MoE
Hibridinis linijinis dėmesys: dauguma sluoksnių naudoja linijinį dėmesį, kas 4 sluoksniai naudoja pilną dėmesį
Gimtoji daugiarūšė: ne pridėta vėliau, o apmokyta nuo pat pradžių

X yra techninė analizė:

"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen

Šios architektūros reikšmė yra: su 17B aktyvių parametrų pasiekti beveik 400B modelio našumą. Išvadų darymo kaina labai sumažėja.

Našumo teiginiai

Alibaba teigia, kad Qwen 3.5 nugalėjo:

GPT-5.2
Claude Opus 4.5
Gemini 3 Pro

X nepriklausomi testuotojai pradeda tikrinti:

"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme

Tačiau svarbiausia yra ne lyginamieji testai, o agento galimybės:

"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly

Agento era

Qwen 3.5 pozicionavimas yra aiškus: sukurtas agento erai.

Gali analizuoti 2 valandų vaizdo įrašus
Gali savarankiškai vykdyti užduotis tarp programų
Gali suprasti GUI ir su juo sąveikauti

"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly

Tai reiškia, kad tai nėra „pokalbių robotas“, o „užduočių vykdytojas“.

Konkurencinė aplinka

X kažkas apibendrino šios savaitės AI leidimus:

"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek

Kinijos modelių gamintojų ritmas yra aiškus:

DeepSeek V4
Qwen 3.5
GLM 5
MiniMax 2.5

Kiekvieną savaitę pasirodo naujas modelis, ir kiekvieną kartą teigiama, kad jis nugalėjo GPT. Tai nėra rinkodara, tai yra išlaidų karo eskalavimas.

Išlaidų struktūra

Qwen 3.5 tokenų kaina yra tik 1/18 Gemini 3 Pro kainos.

"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob

Kai našumas yra panašus, o kaina tik 5%, kur yra uždaro kodo modelių gynybinė siena?

Esmė

Qwen 3.5 nėra „Kinijos GPT“. Tai yra išlaidų struktūros ardytojas:

397B parametrai, bet aktyvuojama tik 17B
Atviri svoriai, galima diegti vietoje
Agento galimybės, ne tik dialogas
Kaina tik 5% konkurentų kainos

X yra įdomi prognozė:

"Qwen 3.5 Q4 版本只需要 225G，很有实用价值" — @janxin

225 GB vaizdo atminties, galima paleisti viename kompiuteryje. Tai reiškia, kad maži ir vidutiniai kūrėjai pirmą kartą gali susipažinti su modeliu, kuris yra artimas GPT-5 lygiui.

Tikrasis klausimas yra ne tai, ar Qwen 3.5 gali nugalėti GPT-5.3, o tai: kaip AI įmonės uždirba pinigus, kai aukščiausio lygio modelių kaina sumažėja beveik iki nulio?

Qwen 3.5 išleistas: 397B parametrų atvirojo svorio modelis, 60% mažesnė kaina

Pagrindiniai duomenys

Architektūros inovacijos

Našumo teiginiai

Agento era

Konkurencinė aplinka

Išlaidų struktūra

Esmė

You Might Also Like

Claude Code Buddy modificavimo vadovas: kaip gauti blizgantį legendinį augintinį

Obsidian pristatė Defuddle, pakeldama Obsidian Web Clipper į naujas aukštumas

OpenAI staiga paskelbė "trijų viename": naršyklė + programavimas + ChatGPT sujungimas, viduje pripažinta, kad per pastaruosius metus buvo padaryta klaida

2026, nebe reikės priversti save "savarankiškai"! Pasirūpinkite šiomis 8 mažomis užduotimis, sveikata ateis natūraliai

Motinos, kurios stengiasi numesti svorio, bet nesugeba, tikrai klysta čia

AI Naršyklė 24 valandų stabilaus veikimo vadovas