Објавен Qwen 3.5: Модел со отворена тежина со 397B параметри, 60% намалување на трошоците

2/16/2026
3 min read

Алибаба штотуку го објави Qwen 3.5-397B-A17B. Ова е првиот модел со отворена тежина од серијата Qwen 3.5.

Клучни податоци

  • Вкупни параметри: 397B
  • Активни параметри: 17B per pass (редок MoE)
  • Пропусност: 8.6x-19x подобрување во однос на Qwen 3-Max
  • Трошоци: 60% намалување во однос на Qwen 3
  • Поддршка за јазици: 201 (проширено од 119)

Ова не е едноставно натрупување на параметри. Ова е редефинирање на ефикасноста.

Qwen 3.5

Архитектонски иновации

Qwen 3.5 користи хибридна архитектура:

  • Gated Delta Networks + редок MoE
  • Хибридно линеарно внимание: Повеќето слоеви користат линеарно внимание, на секои 4 слоеви се користи целосно внимание
  • Нативно мултимодално: Не е додадено подоцна, туку е тренирано од почеток

Има техничка анализа на X:

"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen

Значењето на оваа архитектура е: да се постигне перформанса на модел од речиси 400B со 17B активни параметри. Трошоците за заклучување се значително намалени.

Тврдења за перформанси

Алибаба тврди дека Qwen 3.5 ги победи:

  • GPT-5.2
  • Claude Opus 4.5
  • Gemini 3 Pro

Независни тестери на X почнаа да проверуваат:

"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme

Но, најважно не е тестирањето, туку агентската способност:

"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly

Ера на агенти

Позиционирањето на Qwen 3.5 е јасно: дизајниран за ерата на агенти.

  • Може да анализира 2 часа видео
  • Може самостојно да извршува задачи низ апликации
  • Може да разбере GUI и да комуницира со него

"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly

Ова значи дека не е „четбот“, туку „извршител на задачи“.

Конкурентска средина

Некој на X ги сумираше AI објавите оваа недела:

"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek

Ритам на кинеските производители на модели е јасен:

  • DeepSeek V4
  • Qwen 3.5
  • GLM 5
  • MiniMax 2.5

Секоја недела има нови модели, и секој пат тврдат дека го победиле GPT. Ова не е маркетинг, ова е ескалација на војната на трошоци.

Структура на трошоци

Цената на токен на Qwen 3.5 е само 1/18 од Gemini 3 Pro.

"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob

Кога перформансите се блиску, а трошоците се само 5%, каде е ровот на затворените модели?

Заклучок

Qwen 3.5 не е „кинески GPT“. Тој е нарушувач на структурата на трошоци:

  1. 397B параметри, но само 17B се активираат
  2. Отворена тежина, може да се распореди локално
  3. Агентска способност, не само дијалог
  4. Трошоците се само 5% од конкурентите

Има интересна прогноза на X:

"Qwen 3.5 Q4 版本只需要 225G,很有实用价值" — @janxin

225GB VRAM, може да се изврши на еден компјутер. Ова значи дека малите и средни програмери за прв пат можат да пристапат до модел блиску до нивото на GPT-5.

Вистинското прашање не е дали Qwen 3.5 може да го победи GPT-5.3, туку: како компаниите за вештачка интелигенција заработуваат пари кога трошоците за врвните модели се намалуваат на речиси нула?

Published in Technology

You Might Also Like

Како да користите технологии на облачното компјутерство: Комплетен водич за изградба на вашата прва облачна инфраструктураTechnology

Како да користите технологии на облачното компјутерство: Комплетен водич за изградба на вашата прва облачна инфраструктура

Како да користите технологии на облачното компјутерство: Комплетен водич за изградба на вашата прва облачна инфраструкту...

Предупредување! Основачот на Claude Code изјави: По еден месец, Plan Mode нема да се користи, титулата софтверски инженер ќе исчезнеTechnology

Предупредување! Основачот на Claude Code изјави: По еден месец, Plan Mode нема да се користи, титулата софтверски инженер ќе исчезне

Предупредување! Основачот на Claude Code изјави: По еден месец, Plan Mode нема да се користи, титулата софтверски инжене...

2026 година Топ 10 ресурси за длабоко учењеTechnology

2026 година Топ 10 ресурси за длабоко учење

2026 година Топ 10 ресурси за длабоко учење Со брзиот развој на длабокото учење во различни области, се појавуваат се по...

2026 година Топ 10 AI агенти: Анализа на основните карактеристикиTechnology

2026 година Топ 10 AI агенти: Анализа на основните карактеристики

2026 година Топ 10 AI агенти: Анализа на основните карактеристики Вовед Со брзиот развој на вештачката интелигенција, AI...

2026 година Топ 10 AI алатки препораки: Ослободување на вистинскиот потенцијал на вештачката интелигенцијаTechnology

2026 година Топ 10 AI алатки препораки: Ослободување на вистинскиот потенцијал на вештачката интелигенција

2026 година Топ 10 AI алатки препораки: Ослободување на вистинскиот потенцијал на вештачката интелигенција Во денешно вр...

2026年 Top 10 AWS工具和资源推荐Technology

2026年 Top 10 AWS工具和资源推荐

2026年 Top 10 AWS工具和资源推荐 Во брзо развивачкиот облачен компјутинг сектор, Amazon Web Services (AWS) секогаш бил лидер, нуд...