Qwen 3.5 Хувилбар Гарлаа: 397B Параметр Бүхий Нээлттэй Жинтэй Загвар, Зардал 60%-иар Буурсан
Алибаба саяхан Qwen 3.5-397B-A17B-г гаргалаа. Энэ бол Qwen 3.5 цувралын анхны нээлттэй жинтэй загвар юм.
Гол Мэдээлэл
- Нийт Параметр: 397B
- Идэвхтэй Параметр: 17B per pass (sparse MoE)
- Өнгөрүүлэх Чадвар: Qwen 3-Max-аас 8.6x-19x-оор сайжирсан
- Зардал: Qwen 3-аас 60%-иар буурсан
- Хэлний Дэмжлэг: 201 төрөл (119 төрлөөс өргөжсөн)
Энэ бол энгийн параметрүүдийг овоолох биш. Энэ бол үр ашгийг дахин тодорхойлох явдал юм.

Архитектурын Шинэчлэл
Qwen 3.5 нь холимог архитектур ашигладаг:
- Gated Delta Networks + sparse MoE
- Холимог Шугаман Анхаарал: Ихэнх давхаргууд нь шугаман анхаарал ашигладаг, 4 давхарга тутамд бүрэн анхаарал ашигладаг
- Уугуул Олон Модаль: Хожим нэмээгүй, харин эхнээс нь сургасан
X дээр техникийн шинжилгээ бий:
"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen
Энэхүү архитектурын ач холбогдол нь: 17B идэвхтэй параметрээр 400B загварын гүйцэтгэлд ойртох явдал юм. Дүгнэлт гаргах зардал эрс буурсан.
Гүйцэтгэлийн Мэдэгдэл
Алибаба Qwen 3.5 нь дараах загваруудыг ялсан гэж мэдэгдэв:
- GPT-5.2
- Claude Opus 4.5
- Gemini 3 Pro
X дээрх бие даасан туршигчид баталгаажуулж эхэлсэн:
"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme
Гэхдээ хамгийн чухал нь жишиг тест биш, харин агентын чадвар юм:
"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly
Агентын Эрин Үе
Qwen 3.5-ын байр суурь тодорхой: агентын эрин үед зориулагдсан.
- 2 цагийн видеог шинжлэх боломжтой
- Аппликейшн хоорондын ажлыг бие даан гүйцэтгэх боломжтой
- GUI-г ойлгож, харилцах боломжтой
"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly
Энэ нь түүнийг "чатбот" биш, харин "ажил гүйцэтгэгч" гэсэн үг юм.
Өрсөлдөөний Дүр Зураг
X дээр хэн нэгэн энэ долоо хоногийн AI-н нийтлэлүүдийг нэгтгэн дүгнэсэн:
"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek
Хятадын загвар үйлдвэрлэгчдийн хэмнэл тодорхой байна:
- DeepSeek V4
- Qwen 3.5
- GLM 5
- MiniMax 2.5
Долоо хоног бүр шинэ загвар гарч, GPT-г ялсан гэж мэдэгддэг. Энэ бол маркетинг биш, харин зардлын дайны өргөжилт юм.
Зардлын Бүтэц
Qwen 3.5-ын token-ийн үнэ нь Gemini 3 Pro-ийн 1/18-тэй тэнцүү.
"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob
Гүйцэтгэл нь ойролцоо, зардал нь ердөө 5% байхад хаалттай эх сурвалжтай загварын хамгаалалт хаана байна?
Дүгнэлт
Qwen 3.5 бол "Хятадын GPT" биш. Энэ бол зардлын бүтцийг эвдэгч юм:
- 397B параметр, гэхдээ зөвхөн 17B-г идэвхжүүлдэг
- Нээлттэй жин, орон нутагт байршуулах боломжтой
- Агентын чадвар, зөвхөн яриа биш
- Зардал нь өрсөлдөгчдийнхөө 5%-тай тэнцүү
X дээр сонирхолтой таамаг байна:
"Qwen 3.5 Q4 版本只需要 225G,很有实用价值" — @janxin
225GB график санах ой, ганц машин дээр ажиллах боломжтой. Энэ нь жижиг, дунд хөгжүүлэгчид анх удаа GPT-5 түвшний загварт хүрэх боломжтой гэсэн үг юм.
Жинхэнэ асуудал бол Qwen 3.5 GPT-5.3-г ялах эсэх биш, харин шилдэг загваруудын зардал бараг тэг болж буурахад AI компаниуд хэрхэн мөнгө олох вэ?





