Qwen 3.5 Објављен: Отворени модел тежине са 397B параметара, 60% смањење трошкова
Алибаба је управо објавила Qwen 3.5-397B-A17B. Ово је први модел отворене тежине из серије Qwen 3.5.
Кључни подаци
- Укупни параметри: 397B
- Активни параметри: 17B per pass (sparse MoE)
- Пропусност: 8.6x-19x побољшање у односу на Qwen 3-Max
- Трошкови: 60% смањење у односу на Qwen 3
- Подршка за језике: 201 (проширено са 119)
Ово није једноставно слагање параметара. Ово је редефинисање ефикасности.

Архитектонске иновације
Qwen 3.5 користи хибридну архитектуру:
- Gated Delta Networks + sparse MoE
- Хибридна линеарна пажња: Већина слојева користи линеарну пажњу, сваки 4. слој користи пуну пажњу
- Изворна мултимодалност: Није накнадно додата, већ је тренирана од почетка
На X-у постоји техничка анализа:
"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen
Значење ове архитектуре је: постизање перформанси модела од скоро 400B са 17B активних параметара. Трошкови закључивања су значајно смањени.
Тврдње о перформансама
Алибаба тврди да је Qwen 3.5 победио:
- GPT-5.2
- Claude Opus 4.5
- Gemini 3 Pro
Независни тестери на X-у су почели да верификују:
"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme
Али најважније нису бенчмарк тестови, већ агентске способности:
"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly
Агентска ера
Позиционирање Qwen 3.5 је јасно: дизајниран за агентску еру.
- Може да анализира 2 сата видеа
- Може самостално да извршава задатке у различитим апликацијама
- Може да разуме GUI и да комуницира са њим
"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly
То значи да није „цхатбот“, већ „извршитељ задатака“.
Конкурентски пејзаж
Неко је на X-у сумирао AI објаве ове недеље:
"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek
Ритам кинеских произвођача модела је јасан:
- DeepSeek V4
- Qwen 3.5
- GLM 5
- MiniMax 2.5
Сваке недеље постоји нови модел, и сваки пут тврде да су победили GPT. Ово није маркетинг, ово је ескалација рата трошкова.
Структура трошкова
Цена токена Qwen 3.5 је само 1/18 цене Gemini 3 Pro.
"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob
Када су перформансе сличне, а трошкови само 5%, где је ров затворених модела?
Закључак
Qwen 3.5 није „кинески GPT“. То је реметилац структуре трошкова:
- 397B параметара, али се активира само 17B
- Отворена тежина, може се локално распоредити
- Агентске способности, не само дијалог
- Трошкови су само 5% трошкова конкуренције
На X-у постоји занимљива прогноза:
"Qwen 3.5 Q4 верзија захтева само 225G, што је веома практично" — @janxin
225GB видео меморије, може да се покрене на једном рачунару. То значи да мали и средњи програмери први пут могу да приступе моделу блиском GPT-5 нивоу.
Право питање није да ли Qwen 3.5 може да победи GPT-5.3, већ: како AI компаније зарађују када се трошкови врхунских модела смање на скоро нулу?





