Qwen 3.5 шығарылымы: 397B параметрлі ашық салмақты модель, құны 60%-ға төмендеді

2/16/2026
3 min read

Alibaba жаңа ғана Qwen 3.5-397B-A17B шығарды. Бұл Qwen 3.5 сериясының алғашқы ашық салмақты моделі.

Негізгі деректер

  • Жалпы параметрлер: 397B
  • Белсенді параметрлер: 17B per pass (сирек MoE)
  • Өнімділік: Qwen 3-Max-қа қарағанда 8.6x-19x жоғары
  • Құны: Qwen 3-ке қарағанда 60%-ға төмен
  • Тілдік қолдау: 201 тіл (119 тілден кеңейтілген)

Бұл жай ғана параметрлерді үйіп тастау емес. Бұл тиімділікті қайта анықтау.

Qwen 3.5

Архитектуралық инновация

Qwen 3.5 аралас архитектураны пайдаланады:

  • Gated Delta Networks + сирек MoE
  • Аралас сызықтық назар: Көптеген қабаттар сызықтық назарды пайдаланады, әр 4 қабат сайын толық назар пайдаланылады
  • Түпнұсқалық мультимодальдылық: Кейіннен қосылған емес, басынан бастап үйретілген

X-те техникалық талдау бар:

"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen

Бұл архитектураның маңыздылығы: 17B белсенді параметрлермен 400B модельге жақын өнімділікке қол жеткізу. Қорытындылау құны айтарлықтай төмендеді.

Өнімділік туралы мәлімдеме

Alibaba Qwen 3.5-тің мыналарды жеңгенін мәлімдейді:

  • GPT-5.2
  • Claude Opus 4.5
  • Gemini 3 Pro

X-тегі тәуелсіз тестілеушілер тексеруді бастады:

"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme

Бірақ ең маңыздысы эталондық тест емес, агенттік қабілет: (агенттік - агенттікке тән, агенттікке қатысты)

"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly

Агенттік дәуір

Qwen 3.5-тің позициясы анық: агенттік дәуірге арналған дизайн.

  • 2 сағаттық бейнені талдай алады
  • Қолданбалар арасындағы тапсырмаларды дербес орындай алады
  • GUI-ді түсінеді және онымен әрекеттесе алады

"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly

Бұл оның «чат-боты» емес, «тапсырма орындаушы» екенін білдіреді.

Бәсекелестік ландшафт

X-те біреу осы аптадағы AI шығарылымдарын қорытындылады:

"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek

Қытайлық модель өндірушілерінің ырғағы анық:

  • DeepSeek V4
  • Qwen 3.5
  • GLM 5
  • MiniMax 2.5

Әр апта сайын жаңа модельдер шығады, олардың әрқайсысы GPT-ті жеңгенін мәлімдейді. Бұл маркетинг емес, бұл құн соғысының өршуі.

Құн құрылымы

Qwen 3.5-тің токен бағасы Gemini 3 Pro-дан 1/18 ғана.

"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob

Өнімділік жақын, құны 5% ғана болғанда, жабық бастапқы кодты модельдердің қорғаны қайда?

Түйін

Qwen 3.5 «Қытайлық GPT» емес. Бұл құн құрылымының бұзушысы:

  1. 397B параметр, бірақ тек 17B белсенді
  2. Ашық салмақ, жергілікті жерде орналастыруға болады
  3. Агенттік қабілет, жай ғана диалог емес
  4. Құны бәсекелестердің 5% ғана

X-те қызықты болжам бар:

"Qwen 3.5 Q4 版本只需要 225G,很有实用价值" — @janxin

225GB жады, бір машинада іске қосуға болады. Бұл шағын және орта әзірлеушілердің GPT-5 деңгейіндегі модельге алғаш рет қол жеткізуі дегенді білдіреді.

Нағыз мәселе Qwen 3.5-тің GPT-5.3-ті жеңе ала ма, жоқ па дегенде емес, ең жақсы модельдердің құны нөлге жақын болғанда, AI компаниялары қалай ақша табады?

Published in Technology

You Might Also Like

Бұлтты есептеу технологиясын қалай пайдалану керек: Сіздің алғашқы бұлттық инфрақұрылымыңызды құруға арналған толық нұсқаулықTechnology

Бұлтты есептеу технологиясын қалай пайдалану керек: Сіздің алғашқы бұлттық инфрақұрылымыңызды құруға арналған толық нұсқаулық

Бұлтты есептеу технологиясын қалай пайдалану керек: Сіздің алғашқы бұлттық инфрақұрылымыңызды құруға арналған толық нұсқ...

Ескерту! Claude Code-тың әкесі ашық айтты: 1 айдан кейін Plan Mode қолданылмайды, бағдарламалық инженер атағы жоғаладыTechnology

Ескерту! Claude Code-тың әкесі ашық айтты: 1 айдан кейін Plan Mode қолданылмайды, бағдарламалық инженер атағы жоғалады

Ескерту! Claude Code-тың әкесі ашық айтты: 1 айдан кейін Plan Mode қолданылмайды, бағдарламалық инженер атағы жоғалады ...

2026年 Top 10 深度学习资源推荐Technology

2026年 Top 10 深度学习资源推荐

2026年 Top 10 深度学习资源推荐 随着深度学习在各个领域的迅速发展,越来越多的学习资源和工具涌现出来。本文将为您推荐2026年最值得关注的十个深度学习资源,帮助您在这一领域中快速成长。 1. Coursera Deep Learn...

2026 жылғы Топ 10 AI агенттері: Негізгі артықшылықтарды талдауTechnology

2026 жылғы Топ 10 AI агенттері: Негізгі артықшылықтарды талдау

2026 жылғы Топ 10 AI агенттері: Негізгі артықшылықтарды талдау Кіріспе Жасанды интеллекттің жылдам дамуы арқасында AI аг...

2026 жыл: Топ 10 AI құралдары ұсынысы: Жасанды интеллектінің шынайы әлеуетін ашуTechnology

2026 жыл: Топ 10 AI құралдары ұсынысы: Жасанды интеллектінің шынайы әлеуетін ашу

2026 жыл: Топ 10 AI құралдары ұсынысы: Жасанды интеллектінің шынайы әлеуетін ашу Технологияның жылдам дамып жатқан бүгін...

2026 жылғы AWS құралдары мен ресурстарының 10 үздігіTechnology

2026 жылғы AWS құралдары мен ресурстарының 10 үздігі

2026 жылғы AWS құралдары мен ресурстарының 10 үздігі Жылдам дамып келе жатқан бұлтты есептеу саласында Amazon Web Servic...