Објавен Qwen 3.5: Модел со отворена тежина со 397B параметри, 60% намалување на трошоците

2/16/2026
3 min read

Алибаба штотуку го објави Qwen 3.5-397B-A17B. Ова е првиот модел со отворена тежина од серијата Qwen 3.5.

Клучни податоци

  • Вкупни параметри: 397B
  • Активни параметри: 17B per pass (редок MoE)
  • Пропусност: 8.6x-19x подобрување во однос на Qwen 3-Max
  • Трошоци: 60% намалување во однос на Qwen 3
  • Поддршка за јазици: 201 (проширено од 119)

Ова не е едноставно натрупување на параметри. Ова е редефинирање на ефикасноста.

Qwen 3.5

Архитектонски иновации

Qwen 3.5 користи хибридна архитектура:

  • Gated Delta Networks + редок MoE
  • Хибридно линеарно внимание: Повеќето слоеви користат линеарно внимание, на секои 4 слоеви се користи целосно внимание
  • Нативно мултимодално: Не е додадено подоцна, туку е тренирано од почеток

Има техничка анализа на X:

"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen

Значењето на оваа архитектура е: да се постигне перформанса на модел од речиси 400B со 17B активни параметри. Трошоците за заклучување се значително намалени.

Тврдења за перформанси

Алибаба тврди дека Qwen 3.5 ги победи:

  • GPT-5.2
  • Claude Opus 4.5
  • Gemini 3 Pro

Независни тестери на X почнаа да проверуваат:

"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme

Но, најважно не е тестирањето, туку агентската способност:

"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly

Ера на агенти

Позиционирањето на Qwen 3.5 е јасно: дизајниран за ерата на агенти.

  • Може да анализира 2 часа видео
  • Може самостојно да извршува задачи низ апликации
  • Може да разбере GUI и да комуницира со него

"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly

Ова значи дека не е „четбот“, туку „извршител на задачи“.

Конкурентска средина

Некој на X ги сумираше AI објавите оваа недела:

"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek

Ритам на кинеските производители на модели е јасен:

  • DeepSeek V4
  • Qwen 3.5
  • GLM 5
  • MiniMax 2.5

Секоја недела има нови модели, и секој пат тврдат дека го победиле GPT. Ова не е маркетинг, ова е ескалација на војната на трошоци.

Структура на трошоци

Цената на токен на Qwen 3.5 е само 1/18 од Gemini 3 Pro.

"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob

Кога перформансите се блиску, а трошоците се само 5%, каде е ровот на затворените модели?

Заклучок

Qwen 3.5 не е „кинески GPT“. Тој е нарушувач на структурата на трошоци:

  1. 397B параметри, но само 17B се активираат
  2. Отворена тежина, може да се распореди локално
  3. Агентска способност, не само дијалог
  4. Трошоците се само 5% од конкурентите

Има интересна прогноза на X:

"Qwen 3.5 Q4 版本只需要 225G,很有实用价值" — @janxin

225GB VRAM, може да се изврши на еден компјутер. Ова значи дека малите и средни програмери за прв пат можат да пристапат до модел блиску до нивото на GPT-5.

Вистинското прашање не е дали Qwen 3.5 може да го победи GPT-5.3, туку: како компаниите за вештачка интелигенција заработуваат пари кога трошоците за врвните модели се намалуваат на речиси нула?

Published in Technology

You Might Also Like

📝
Technology

Claude Code Buddy измена упатство: Како да добиете сјаен легендарен милениче

Claude Code Buddy измена упатство: Како да добиете сјаен легендарен милениче На 1 април 2026 година, Anthropic во верзиј...

Obsidian ја лансираше Defuddle, го подигна Obsidian Web Clipper на ново нивоTechnology

Obsidian ја лансираше Defuddle, го подигна Obsidian Web Clipper на ново ниво

Obsidian ја лансираше Defuddle, го подигна Obsidian Web Clipper на ново ниво Уште од почетокот, многу ми се допаѓа осно...

OpenAI ненадејно објави "три во едно": спојување на прелистувач, програмирање и ChatGPT, внатрешно признавање на погрешниот пат во изминатата годинаTechnology

OpenAI ненадејно објави "три во едно": спојување на прелистувач, програмирање и ChatGPT, внатрешно признавање на погрешниот пат во изминатата година

OpenAI ненадејно објави "три во едно": спојување на прелистувач, програмирање и ChatGPT, внатрешно признавање на погрешн...

2026, не се присилувајте на "самодисциплина"! Направете ги овие 8 мали работи, здравјето ќе дојде природноHealth

2026, не се присилувајте на "самодисциплина"! Направете ги овие 8 мали работи, здравјето ќе дојде природно

2026, не се присилувајте на "самодисциплина"! Направете ги овие 8 мали работи, здравјето ќе дојде природно Нова година ...

Тие мајки кои се трудат да ослабат, но не успеваат, сигурно се заглавени тукаHealth

Тие мајки кои се трудат да ослабат, но не успеваат, сигурно се заглавени тука

Тие мајки кои се трудат да ослабат, но не успеваат, сигурно се заглавени тука Март веќе помина наполовина, како напреду...

📝
Technology

AI Browser 24 часов стабилно работење водич

AI Browser 24 часов стабилно работење водич Овој туторијал објаснува како да се постави стабилна, долгорочна средина за ...