Qwen 3.5 выпущен: модель с открытым весом и 397B параметрами, стоимость снижена на 60%

2/16/2026
3 min read

Alibaba только что выпустила Qwen 3.5-397B-A17B. Это первая модель с открытым весом из серии Qwen 3.5.

Ключевые данные

  • Общее количество параметров: 397B
  • Активные параметры: 17B per pass (разреженная MoE)
  • Пропускная способность: в 8.6x-19x раз выше, чем у Qwen 3-Max
  • Стоимость: на 60% ниже, чем у Qwen 3
  • Поддержка языков: 201 (расширена с 119)

Это не простое наращивание параметров. Это переосмысление эффективности.

Qwen 3.5

Архитектурные инновации

Qwen 3.5 использует гибридную архитектуру:

  • Gated Delta Networks + разреженная MoE
  • Гибридное линейное внимание: большинство слоев используют линейное внимание, каждый 4-й слой использует полное внимание
  • Нативная мультимодальность: не добавляется позже, а обучается с нуля

В X есть технический анализ:

"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen

Смысл этой архитектуры в том, чтобы: достичь производительности модели, близкой к 400B, с 17B активных параметров. Стоимость инференса значительно снижается.

Заявленная производительность

Alibaba утверждает, что Qwen 3.5 превзошла:

  • GPT-5.2
  • Claude Opus 4.5
  • Gemini 3 Pro

Независимые тестировщики в X начали проверку:

"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme

Но самое главное - не бенчмарки, а агентские возможности:

"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly

Эпоха агентов

Позиционирование Qwen 3.5 очень четкое: разработана для эпохи агентов.

  • Может анализировать 2-часовое видео
  • Может самостоятельно выполнять задачи между приложениями
  • Может понимать GUI и взаимодействовать с ним

"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly

Это означает, что это не «чат-бот», а «исполнитель задач».

Конкурентная среда

В X кто-то подытожил выпуски AI на этой неделе:

"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek

Ритм китайских производителей моделей очень ясен:

  • DeepSeek V4
  • Qwen 3.5
  • GLM 5
  • MiniMax 2.5

Каждую неделю появляется новая модель, и каждый раз утверждается, что она превосходит GPT. Это не маркетинг, это эскалация ценовой войны.

Структура затрат

Цена токена Qwen 3.5 составляет всего 1/18 от цены Gemini 3 Pro.

"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob

Когда производительность близка, а стоимость составляет всего 5%, где находится крепость закрытых моделей?

Итог

Qwen 3.5 - это не «китайский GPT». Это разрушитель структуры затрат:

  1. 397B параметров, но активируется только 17B
  2. Открытый вес, можно развернуть локально
  3. Агентские возможности, а не просто диалог
  4. Стоимость составляет всего 5% от стоимости конкурентов

В X есть интересный прогноз:

"Qwen 3.5 Q4 版本只需要 225G,很有实用价值" — @janxin

225GB видеопамяти, можно запустить на одном компьютере. Это означает, что малые и средние разработчики впервые смогут получить доступ к модели, близкой к уровню GPT-5.

Настоящий вопрос не в том, сможет ли Qwen 3.5 превзойти GPT-5.3, а в том: как AI-компании будут зарабатывать деньги, когда стоимость топовых моделей упадет почти до нуля?

Published in Technology

You Might Also Like

Как использовать технологии облачных вычислений: Полное руководство по созданию вашей первой облачной инфраструктурыTechnology

Как использовать технологии облачных вычислений: Полное руководство по созданию вашей первой облачной инфраструктуры

Как использовать технологии облачных вычислений: Полное руководство по созданию вашей первой облачной инфраструктуры Вве...

Предупреждение! Отец Claude Code прямо говорит: через месяц без режима планирования титул программиста исчезнетTechnology

Предупреждение! Отец Claude Code прямо говорит: через месяц без режима планирования титул программиста исчезнет

Предупреждение! Отец Claude Code прямо говорит: через месяц без режима планирования титул программиста исчезнет Недавно...

2026年 Top 10 深度学习资源推荐Technology

2026年 Top 10 深度学习资源推荐

2026年 Top 10 深度学习资源推荐 随着深度学习在各个领域的迅速发展,越来越多的学习资源和工具涌现出来。本文将为您推荐2026年最值得关注的十个深度学习资源,帮助您在这一领域中快速成长。 1. Coursera Deep Learn...

Топ 10 AI агентов 2026 года: анализ ключевых преимуществTechnology

Топ 10 AI агентов 2026 года: анализ ключевых преимуществ

Топ 10 AI агентов 2026 года: анализ ключевых преимуществ Введение С быстрым развитием искусственного интеллекта AI агент...

Рекомендации по 10 лучшим инструментам ИИ на 2026 год: раскрытие истинного потенциала искусственного интеллектаTechnology

Рекомендации по 10 лучшим инструментам ИИ на 2026 год: раскрытие истинного потенциала искусственного интеллекта

Рекомендации по 10 лучшим инструментам ИИ на 2026 год: раскрытие истинного потенциала искусственного интеллекта В эпоху ...

Топ 10 инструментов и ресурсов AWS на 2026 годTechnology

Топ 10 инструментов и ресурсов AWS на 2026 год

Топ 10 инструментов и ресурсов AWS на 2026 год В быстро развивающейся области облачных вычислений Amazon Web Services (A...