Qwen 3.5 Објављен: Отворени модел тежине са 397B параметара, 60% смањење трошкова

Алибаба је управо објавила Qwen 3.5-397B-A17B. Ово је први модел отворене тежине из серије Qwen 3.5.

Кључни подаци

Укупни параметри: 397B
Активни параметри: 17B per pass (sparse MoE)
Пропусност: 8.6x-19x побољшање у односу на Qwen 3-Max
Трошкови: 60% смањење у односу на Qwen 3
Подршка за језике: 201 (проширено са 119)

Ово није једноставно слагање параметара. Ово је редефинисање ефикасности.

Qwen 3.5

Архитектонске иновације

Qwen 3.5 користи хибридну архитектуру:

Gated Delta Networks + sparse MoE
Хибридна линеарна пажња: Већина слојева користи линеарну пажњу, сваки 4. слој користи пуну пажњу
Изворна мултимодалност: Није накнадно додата, већ је тренирана од почетка

На X-у постоји техничка анализа:

"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen

Значење ове архитектуре је: постизање перформанси модела од скоро 400B са 17B активних параметара. Трошкови закључивања су значајно смањени.

Тврдње о перформансама

Алибаба тврди да је Qwen 3.5 победио:

GPT-5.2
Claude Opus 4.5
Gemini 3 Pro

Независни тестери на X-у су почели да верификују:

"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme

Али најважније нису бенчмарк тестови, већ агентске способности:

"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly

Агентска ера

Позиционирање Qwen 3.5 је јасно: дизајниран за агентску еру.

Може да анализира 2 сата видеа
Може самостално да извршава задатке у различитим апликацијама
Може да разуме GUI и да комуницира са њим

"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly

То значи да није „цхатбот“, већ „извршитељ задатака“.

Конкурентски пејзаж

Неко је на X-у сумирао AI објаве ове недеље:

"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek

Ритам кинеских произвођача модела је јасан:

DeepSeek V4
Qwen 3.5
GLM 5
MiniMax 2.5

Сваке недеље постоји нови модел, и сваки пут тврде да су победили GPT. Ово није маркетинг, ово је ескалација рата трошкова.

Структура трошкова

Цена токена Qwen 3.5 је само 1/18 цене Gemini 3 Pro.

"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob

Када су перформансе сличне, а трошкови само 5%, где је ров затворених модела?

Закључак

Qwen 3.5 није „кинески GPT“. То је реметилац структуре трошкова:

397B параметара, али се активира само 17B
Отворена тежина, може се локално распоредити
Агентске способности, не само дијалог
Трошкови су само 5% трошкова конкуренције

На X-у постоји занимљива прогноза:

"Qwen 3.5 Q4 верзија захтева само 225G, што је веома практично" — @janxin

225GB видео меморије, може да се покрене на једном рачунару. То значи да мали и средњи програмери први пут могу да приступе моделу блиском GPT-5 нивоу.

Право питање није да ли Qwen 3.5 може да победи GPT-5.3, већ: како AI компаније зарађују када се трошкови врхунских модела смање на скоро нулу?

Qwen 3.5 Објављен: Отворени модел тежине са 397B параметара, 60% смањење трошкова

Кључни подаци

Архитектонске иновације

Тврдње о перформансама

Агентска ера

Конкурентски пејзаж

Структура трошкова

Закључак

You Might Also Like

Claude Code Buddy модификација: Како добити сјајног легендарног љубимца

Obsidian je lansirao Defuddle, podigao Obsidian Web Clipper na novi nivo

OpenAI iznenada najavljuje "tri u jednom": spajanje pretraživača + programiranja + ChatGPT, unutrašnje priznanje da su prošle godine pogrešili

2026, ne prisiljavajte se na "disciplinu"! Uradite ovih 8 malih stvari, zdravlje će doći prirodno

One of the reasons why mothers who work hard to lose weight can't succeed is definitely here

AI Browser 24-сатна стабилна операција