Qwen 3.5 Издаден: Модел с отворени тегла с 397B параметри, 60% намаление на разходите

2/16/2026
3 min read

Alibaba току-що пусна Qwen 3.5-397B-A17B. Това е първият модел с отворени тегла от серията Qwen 3.5.

Основни данни

  • Общ брой параметри: 397B
  • Активирани параметри: 17B на преминаване (разреден MoE)
  • Производителност: 8.6x-19x подобрение спрямо Qwen 3-Max
  • Разходи: 60% намаление спрямо Qwen 3
  • Поддръжка на езици: 201 (разширено от 119)

Това не е просто натрупване на параметри. Това е предефиниране на ефективността.

Qwen 3.5

Архитектурни иновации

Qwen 3.5 използва хибридна архитектура:

  • Gated Delta Networks + разреден MoE
  • Хибридно линейно внимание: повечето слоеве използват линейно внимание, на всеки 4 слоя се използва пълно внимание
  • Естествена мултимодалност: не е добавена по-късно, а е обучена от нулата

Има технически анализ в X:

"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen

Значението на тази архитектура е: да се постигне производителност, близка до 400B модел, с 17B активирани параметри. Разходите за извод са значително намалени.

Изявления за производителност

Alibaba твърди, че Qwen 3.5 е победил:

  • GPT-5.2
  • Claude Opus 4.5
  • Gemini 3 Pro

Независими тестери в X започнаха да проверяват:

"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme

Но най-важното не са бенчмарковете, а агентните възможности:

"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly

Ерата на агентите

Позиционирането на Qwen 3.5 е ясно: проектиран за ерата на агентите.

  • Може да анализира 2-часови видеоклипове
  • Може самостоятелно да изпълнява задачи в различни приложения
  • Може да разбира GUI и да взаимодейства с тях

"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly

Това означава, че не е „чатбот“, а „изпълнител на задачи“.

Конкурентна среда

Някой в X обобщи AI изданията тази седмица:

"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek

Ритъмът на китайските производители на модели е ясен:

  • DeepSeek V4
  • Qwen 3.5
  • GLM 5
  • MiniMax 2.5

Всяка седмица има нов модел и всеки път се твърди, че е победил GPT. Това не е маркетинг, това е ескалация на ценовата война.

Структура на разходите

Цената на токените на Qwen 3.5 е само 1/18 от тази на Gemini 3 Pro.

"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob

Когато производителността е близка, а разходите са само 5%, къде е защитната стена на затворените модели?

Заключение

Qwen 3.5 не е „китайски GPT“. Той е нарушител на структурата на разходите:

  1. 397B параметри, но само 17B са активирани
  2. Отворени тегла, могат да бъдат разположени локално
  3. Агентни възможности, не само диалог
  4. Разходите са само 5% от тези на конкурентите

Има интересна прогноза в X:

"Qwen 3.5 Q4 版本只需要 225G,很有实用价值" — @janxin

Необходими са 225GB VRAM, може да се изпълнява на една машина. Това означава, че малките и средни разработчици за първи път могат да имат достъп до модел, близък до нивото на GPT-5.

Истинският въпрос не е дали Qwen 3.5 може да победи GPT-5.3, а: как AI компаниите ще печелят пари, когато цената на най-добрите модели падне почти до нула?

Published in Technology

You Might Also Like

Как да използвате облачни технологии: Пълен наръчник за изграждане на вашата първа облачна инфраструктураTechnology

Как да използвате облачни технологии: Пълен наръчник за изграждане на вашата първа облачна инфраструктура

Как да използвате облачни технологии: Пълен наръчник за изграждане на вашата първа облачна инфраструктура Въведение С ус...

Предупреждение! Бащата на Claude Code открито заявява: След месец, без Plan Mode, титлата софтуерен инженер ще изчезнеTechnology

Предупреждение! Бащата на Claude Code открито заявява: След месец, без Plan Mode, титлата софтуерен инженер ще изчезне

Предупреждение! Бащата на Claude Code открито заявява: След месец, без Plan Mode, титлата софтуерен инженер ще изчезне ...

2026年 Top 10 深度学习资源推荐Technology

2026年 Top 10 深度学习资源推荐

2026年 Top 10 深度学习资源推荐 С развитието на дълбокото обучение в различни области, все повече учебни ресурси и инструменти се ...

2026年 Top 10 AI 代理:核心卖点解析Technology

2026年 Top 10 AI 代理:核心卖点解析

2026年 Top 10 AI 代理:核心卖点解析 引言 С бързото развитие на изкуствения интелект, AI агенти (AI Agents) станаха гореща тема в тех...

2026年 Top 10 AI 工具推荐:释放人工智能的真正潜力Technology

2026年 Top 10 AI 工具推荐:释放人工智能的真正潜力

2026年 Top 10 AI 工具推荐:释放人工智能的真正潜力 В днешния ден, когато технологиите напредват с бързи темпове, изкуственият интелект (AI...

2026年 Top 10 AWS工具和资源推荐Technology

2026年 Top 10 AWS工具和资源推荐

2026年 Top 10 AWS工具和资源推荐 В бързо развиващата се област на облачните изчисления, Amazon Web Services (AWS) винаги е била л...