Qwen 3.5 Хувилбар Гарлаа: 397B Параметр Бүхий Нээлттэй Жинтэй Загвар, Зардал 60%-иар Буурсан

2/16/2026
3 min read

Алибаба саяхан Qwen 3.5-397B-A17B-г гаргалаа. Энэ бол Qwen 3.5 цувралын анхны нээлттэй жинтэй загвар юм.

Гол Мэдээлэл

  • Нийт Параметр: 397B
  • Идэвхтэй Параметр: 17B per pass (sparse MoE)
  • Өнгөрүүлэх Чадвар: Qwen 3-Max-аас 8.6x-19x-оор сайжирсан
  • Зардал: Qwen 3-аас 60%-иар буурсан
  • Хэлний Дэмжлэг: 201 төрөл (119 төрлөөс өргөжсөн)

Энэ бол энгийн параметрүүдийг овоолох биш. Энэ бол үр ашгийг дахин тодорхойлох явдал юм.

Qwen 3.5

Архитектурын Шинэчлэл

Qwen 3.5 нь холимог архитектур ашигладаг:

  • Gated Delta Networks + sparse MoE
  • Холимог Шугаман Анхаарал: Ихэнх давхаргууд нь шугаман анхаарал ашигладаг, 4 давхарга тутамд бүрэн анхаарал ашигладаг
  • Уугуул Олон Модаль: Хожим нэмээгүй, харин эхнээс нь сургасан

X дээр техникийн шинжилгээ бий:

"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen

Энэхүү архитектурын ач холбогдол нь: 17B идэвхтэй параметрээр 400B загварын гүйцэтгэлд ойртох явдал юм. Дүгнэлт гаргах зардал эрс буурсан.

Гүйцэтгэлийн Мэдэгдэл

Алибаба Qwen 3.5 нь дараах загваруудыг ялсан гэж мэдэгдэв:

  • GPT-5.2
  • Claude Opus 4.5
  • Gemini 3 Pro

X дээрх бие даасан туршигчид баталгаажуулж эхэлсэн:

"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme

Гэхдээ хамгийн чухал нь жишиг тест биш, харин агентын чадвар юм:

"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly

Агентын Эрин Үе

Qwen 3.5-ын байр суурь тодорхой: агентын эрин үед зориулагдсан.

  • 2 цагийн видеог шинжлэх боломжтой
  • Аппликейшн хоорондын ажлыг бие даан гүйцэтгэх боломжтой
  • GUI-г ойлгож, харилцах боломжтой

"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly

Энэ нь түүнийг "чатбот" биш, харин "ажил гүйцэтгэгч" гэсэн үг юм.

Өрсөлдөөний Дүр Зураг

X дээр хэн нэгэн энэ долоо хоногийн AI-н нийтлэлүүдийг нэгтгэн дүгнэсэн:

"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek

Хятадын загвар үйлдвэрлэгчдийн хэмнэл тодорхой байна:

  • DeepSeek V4
  • Qwen 3.5
  • GLM 5
  • MiniMax 2.5

Долоо хоног бүр шинэ загвар гарч, GPT-г ялсан гэж мэдэгддэг. Энэ бол маркетинг биш, харин зардлын дайны өргөжилт юм.

Зардлын Бүтэц

Qwen 3.5-ын token-ийн үнэ нь Gemini 3 Pro-ийн 1/18-тэй тэнцүү.

"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob

Гүйцэтгэл нь ойролцоо, зардал нь ердөө 5% байхад хаалттай эх сурвалжтай загварын хамгаалалт хаана байна?

Дүгнэлт

Qwen 3.5 бол "Хятадын GPT" биш. Энэ бол зардлын бүтцийг эвдэгч юм:

  1. 397B параметр, гэхдээ зөвхөн 17B-г идэвхжүүлдэг
  2. Нээлттэй жин, орон нутагт байршуулах боломжтой
  3. Агентын чадвар, зөвхөн яриа биш
  4. Зардал нь өрсөлдөгчдийнхөө 5%-тай тэнцүү

X дээр сонирхолтой таамаг байна:

"Qwen 3.5 Q4 版本只需要 225G,很有实用价值" — @janxin

225GB график санах ой, ганц машин дээр ажиллах боломжтой. Энэ нь жижиг, дунд хөгжүүлэгчид анх удаа GPT-5 түвшний загварт хүрэх боломжтой гэсэн үг юм.

Жинхэнэ асуудал бол Qwen 3.5 GPT-5.3-г ялах эсэх биш, харин шилдэг загваруудын зардал бараг тэг болж буурахад AI компаниуд хэрхэн мөнгө олох вэ?

Published in Technology

You Might Also Like

Хэрхэн үүлний тооцооллын технологийг ашиглах вэ: Таны анхны үүлний инфраструкцийг байгуулах бүрэн гарын авлагаTechnology

Хэрхэн үүлний тооцооллын технологийг ашиглах вэ: Таны анхны үүлний инфраструкцийг байгуулах бүрэн гарын авлага

[[HTMLPLACEHOLDER0]] [[HTMLPLACEHOLDER1]] [[HTMLPLACEHOLDER2]] [[HTMLPLACEHOLDER3]] [[HTMLPLACEHOLDER4]] [[HTMLPLACEHOLD...

Сэрэмжлүүлэг! Claude Code-ийн эцэг шууд хэллээ: 1 сарын дараа Plan Mode хэрэггүй болно, програм хангамжийн инженерийн цол алга болноTechnology

Сэрэмжлүүлэг! Claude Code-ийн эцэг шууд хэллээ: 1 сарын дараа Plan Mode хэрэггүй болно, програм хангамжийн инженерийн цол алга болно

Сэрэмжлүүлэг! Claude Code-ийн эцэг шууд хэллээ: 1 сарын дараа Plan Mode хэрэггүй болно, програм хангамжийн инженерийн цо...

2026年 Top 10 深度学习资源推荐Technology

2026年 Top 10 深度学习资源推荐

2026年 Top 10 深度学习资源推荐 深度 суралцах хурдан хөгжиж байгаа тул олон төрлийн суралцах материал, хэрэгсэл гарч ирж байна. Энэ ...

2026 оны Топ 10 AI агент: Гол борлуулалтын цэгүүдийн тайлбарTechnology

2026 оны Топ 10 AI агент: Гол борлуулалтын цэгүүдийн тайлбар

2026 оны Топ 10 AI агент: Гол борлуулалтын цэгүүдийн тайлбар Оршил Хиймэл оюун ухааны хурдтай хөгжлийн хамт, AI агентууд...

2026 оны шилдэг 10 AI хэрэгслийг санал болгож байна: Хүний оюун ухааны жинхэнэ потенциалыг чөлөөлөхTechnology

2026 оны шилдэг 10 AI хэрэгслийг санал болгож байна: Хүний оюун ухааны жинхэнэ потенциалыг чөлөөлөх

2026 оны шилдэг 10 AI хэрэгслийг санал болгож байна: Хүний оюун ухааны жинхэнэ потенциалыг чөлөөлөх Технологи хурдтай хө...

2026 оны Top 10 AWS хэрэгсэл ба нөөцийн саналTechnology

2026 оны Top 10 AWS хэрэгсэл ба нөөцийн санал

2026 оны Top 10 AWS хэрэгсэл ба нөөцийн санал Хурдан хөгжиж буй үүлний тооцооллын салбарт Amazon Web Services (AWS) нь т...