Qwen 3.5 Publikohet: Model me Pesha të Hapura me 397B Parametra, Kosto e Reduktuar me 60%

2/16/2026
1 min read

Alibaba sapo ka publikuar Qwen 3.5-397B-A17B. Ky është modeli i parë me pesha të hapura i serisë Qwen 3.5.

Të dhëna Kryesore

  • Parametra Gjithsej: 397B
  • Parametra Aktivë: 17B për kalim (MoE i rrallë)
  • Përpunimi: 8.6x-19x më i lartë se Qwen 3-Max
  • Kosto: 60% më e ulët se Qwen 3
  • Mbështetje Gjuhësore: 201 gjuhë (zgjeruar nga 119 gjuhë)

Ky nuk është thjesht grumbullim parametrash. Ky është ripërcaktim i efikasitetit.

Qwen 3.5

Inovacione Arkitekturore

Qwen 3.5 përdor një arkitekturë të përzier:

  • Gated Delta Networks + MoE i rrallë
  • Vëmendje Lineare e Përzier: Shumica e shtresave përdorin vëmendje lineare, çdo 4 shtresa përdorin vëmendje të plotë
  • Multimodale Native: Nuk është shtuar më vonë, por është trajnuar nga e para

Ka analiza teknike në X:

\

Published in Technology

You Might Also Like