Qwen 3.5 Хувилбар Гарлаа: 397B Параметр Бүхий Нээлттэй Жинтэй Загвар, Зардал 60%-иар Буурсан

Алибаба саяхан Qwen 3.5-397B-A17B-г гаргалаа. Энэ бол Qwen 3.5 цувралын анхны нээлттэй жинтэй загвар юм.

Гол Мэдээлэл

Нийт Параметр: 397B
Идэвхтэй Параметр: 17B per pass (sparse MoE)
Өнгөрүүлэх Чадвар: Qwen 3-Max-аас 8.6x-19x-оор сайжирсан
Зардал: Qwen 3-аас 60%-иар буурсан
Хэлний Дэмжлэг: 201 төрөл (119 төрлөөс өргөжсөн)

Энэ бол энгийн параметрүүдийг овоолох биш. Энэ бол үр ашгийг дахин тодорхойлох явдал юм.

Qwen 3.5

Архитектурын Шинэчлэл

Qwen 3.5 нь холимог архитектур ашигладаг:

Gated Delta Networks + sparse MoE
Холимог Шугаман Анхаарал: Ихэнх давхаргууд нь шугаман анхаарал ашигладаг, 4 давхарга тутамд бүрэн анхаарал ашигладаг
Уугуул Олон Модаль: Хожим нэмээгүй, харин эхнээс нь сургасан

X дээр техникийн шинжилгээ бий:

"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen

Энэхүү архитектурын ач холбогдол нь: 17B идэвхтэй параметрээр 400B загварын гүйцэтгэлд ойртох явдал юм. Дүгнэлт гаргах зардал эрс буурсан.

Гүйцэтгэлийн Мэдэгдэл

Алибаба Qwen 3.5 нь дараах загваруудыг ялсан гэж мэдэгдэв:

GPT-5.2
Claude Opus 4.5
Gemini 3 Pro

X дээрх бие даасан туршигчид баталгаажуулж эхэлсэн:

"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme

Гэхдээ хамгийн чухал нь жишиг тест биш, харин агентын чадвар юм:

"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly

Агентын Эрин Үе

Qwen 3.5-ын байр суурь тодорхой: агентын эрин үед зориулагдсан.

2 цагийн видеог шинжлэх боломжтой
Аппликейшн хоорондын ажлыг бие даан гүйцэтгэх боломжтой
GUI-г ойлгож, харилцах боломжтой

"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly

Энэ нь түүнийг "чатбот" биш, харин "ажил гүйцэтгэгч" гэсэн үг юм.

Өрсөлдөөний Дүр Зураг

X дээр хэн нэгэн энэ долоо хоногийн AI-н нийтлэлүүдийг нэгтгэн дүгнэсэн:

"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek

Хятадын загвар үйлдвэрлэгчдийн хэмнэл тодорхой байна:

DeepSeek V4
Qwen 3.5
GLM 5
MiniMax 2.5

Долоо хоног бүр шинэ загвар гарч, GPT-г ялсан гэж мэдэгддэг. Энэ бол маркетинг биш, харин зардлын дайны өргөжилт юм.

Зардлын Бүтэц

Qwen 3.5-ын token-ийн үнэ нь Gemini 3 Pro-ийн 1/18-тэй тэнцүү.

"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob

Гүйцэтгэл нь ойролцоо, зардал нь ердөө 5% байхад хаалттай эх сурвалжтай загварын хамгаалалт хаана байна?

Дүгнэлт

Qwen 3.5 бол "Хятадын GPT" биш. Энэ бол зардлын бүтцийг эвдэгч юм:

397B параметр, гэхдээ зөвхөн 17B-г идэвхжүүлдэг
Нээлттэй жин, орон нутагт байршуулах боломжтой
Агентын чадвар, зөвхөн яриа биш
Зардал нь өрсөлдөгчдийнхөө 5%-тай тэнцүү

X дээр сонирхолтой таамаг байна:

"Qwen 3.5 Q4 版本只需要 225G，很有实用价值" — @janxin

225GB график санах ой, ганц машин дээр ажиллах боломжтой. Энэ нь жижиг, дунд хөгжүүлэгчид анх удаа GPT-5 түвшний загварт хүрэх боломжтой гэсэн үг юм.

Жинхэнэ асуудал бол Qwen 3.5 GPT-5.3-г ялах эсэх биш, харин шилдэг загваруудын зардал бараг тэг болж буурахад AI компаниуд хэрхэн мөнгө олох вэ?

Qwen 3.5 Хувилбар Гарлаа: 397B Параметр Бүхий Нээлттэй Жинтэй Загвар, Зардал 60%-иар Буурсан

Гол Мэдээлэл

Архитектурын Шинэчлэл

Гүйцэтгэлийн Мэдэгдэл

Агентын Эрин Үе

Өрсөлдөөний Дүр Зураг

Зардлын Бүтэц

Дүгнэлт

You Might Also Like

Claude Code Buddy засварын гарын авлага: Гялалзсан домогт амьтан хэрхэн авах вэ

Obsidian Defuddle-г танилцууллаа, Obsidian Web Clipper-ийг шинэ түвшинд гаргалаа

OpenAI гэнэт "Гурван нэг"-ийг зарлалаа: Браузер + Программчлал + ChatGPT нэгдэж, дотооддоо өнгөрсөн жил буруу замаар явсан гэдгээ хүлээн зөвшөөрчээ

2026, өөрийгөө "засаглах" гэж бүү шах! Энэ 8 жижиг зүйлийг сайн хий, эрүүл мэнд өөрөө ирнэ

Тэрээр жингээ хасахад хичээж байгаа ээжүүд, яагаад чадахгүй байна вэ?

AI Браузер 24 цагийн тогтвортой ажиллах гарын авлага