Qwen 3.5 ಬಿಡುಗಡೆ: 397B ನಿಯತಾಂಕಗಳ ತೆರೆದ ತೂಕದ ಮಾದರಿ, ವೆಚ್ಚದಲ್ಲಿ 60% ಇಳಿಕೆ

ಅಲಿಬಾಬಾ ಈಗಷ್ಟೇ Qwen 3.5-397B-A17B ಅನ್ನು ಬಿಡುಗಡೆ ಮಾಡಿದೆ. ಇದು Qwen 3.5 ಸರಣಿಯ ಮೊದಲ ತೆರೆದ ತೂಕದ ಮಾದರಿಯಾಗಿದೆ.

ಪ್ರಮುಖ ದತ್ತಾಂಶ

ಒಟ್ಟು ನಿಯತಾಂಕಗಳು: 397B
ಸಕ್ರಿಯ ನಿಯತಾಂಕಗಳು: 17B ಪ್ರತಿ ಪಾಸ್‌ಗೆ (ವಿರಳ MoE)
ಥ್ರೋಪುಟ್: Qwen 3-Max ಗಿಂತ 8.6x-19x ಹೆಚ್ಚಳ
ವೆಚ್ಚ: Qwen 3 ಗಿಂತ 60% ಕಡಿಮೆ
ಭಾಷಾ ಬೆಂಬಲ: 201 ವಿಧಗಳು (119 ವಿಧಗಳಿಂದ ವಿಸ್ತರಿಸಲಾಗಿದೆ)

ಇದು ಸರಳವಾದ ನಿಯತಾಂಕಗಳ ಜೋಡಣೆಯಲ್ಲ. ಇದು ದಕ್ಷತೆಯ ಮರು ವ್ಯಾಖ್ಯಾನ.

Qwen 3.5

ವಾಸ್ತುಶಿಲ್ಪದ ನಾವೀನ್ಯತೆ

Qwen 3.5 ಮಿಶ್ರ ವಾಸ್ತುಶಿಲ್ಪವನ್ನು ಬಳಸುತ್ತದೆ:

Gated Delta Networks + ವಿರಳ MoE
ಮಿಶ್ರ ರೇಖೀಯ ಗಮನ: ಹೆಚ್ಚಿನ ಪದರಗಳು ರೇಖೀಯ ಗಮನವನ್ನು ಬಳಸುತ್ತವೆ, ಪ್ರತಿ 4 ಪದರಗಳು ಪೂರ್ಣ ಗಮನವನ್ನು ಬಳಸುತ್ತವೆ
ಸ್ಥಳೀಯ ಬಹು ಮಾದರಿ: ನಂತರ ಸೇರಿಸಲಾಗಿಲ್ಲ, ಆದರೆ ಮೊದಲಿನಿಂದ ತರಬೇತಿ ನೀಡಲಾಗಿದೆ

X ನಲ್ಲಿ ತಾಂತ್ರಿಕ ವಿಶ್ಲೇಷಣೆ ಇದೆ:

"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen

ಈ ವಾಸ್ತುಶಿಲ್ಪದ ಅರ್ಥವೇನೆಂದರೆ: 17B ಸಕ್ರಿಯ ನಿಯತಾಂಕಗಳೊಂದಿಗೆ 400B ಮಾದರಿಯ ಕಾರ್ಯಕ್ಷಮತೆಯನ್ನು ಸಾಧಿಸುವುದು. ಅನುಮಾನದ ವೆಚ್ಚವು ಗಣನೀಯವಾಗಿ ಕಡಿಮೆಯಾಗಿದೆ.

ಕಾರ್ಯಕ್ಷಮತೆಯ ಹೇಳಿಕೆ

Qwen 3.5 ಸೋಲಿಸಿದೆ ಎಂದು ಅಲಿಬಾಬಾ ಹೇಳಿಕೊಂಡಿದೆ:

GPT-5.2
Claude Opus 4.5
Gemini 3 Pro

X ನಲ್ಲಿ ಸ್ವತಂತ್ರ ಪರೀಕ್ಷಕರು ಪರಿಶೀಲಿಸಲು ಪ್ರಾರಂಭಿಸಿದ್ದಾರೆ:

"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme

ಆದರೆ ಅತ್ಯಂತ ನಿರ್ಣಾಯಕವಾದುದು ಮಾನದಂಡ ಪರೀಕ್ಷೆಯಲ್ಲ, ಆದರೆ ಏಜೆಂಟ್ ಸಾಮರ್ಥ್ಯ:

"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly

ಏಜೆಂಟ್ ಯುಗ

Qwen 3.5 ರ ಸ್ಥಾನೀಕರಣವು ಸ್ಪಷ್ಟವಾಗಿದೆ: ಏಜೆಂಟ್ ಯುಗಕ್ಕಾಗಿ ವಿನ್ಯಾಸಗೊಳಿಸಲಾಗಿದೆ.

2 ಗಂಟೆಗಳ ವೀಡಿಯೊವನ್ನು ವಿಶ್ಲೇಷಿಸಬಹುದು
ಅಪ್ಲಿಕೇಶನ್‌ಗಳಾದ್ಯಂತ ಸ್ವತಂತ್ರವಾಗಿ ಕಾರ್ಯಗಳನ್ನು ನಿರ್ವಹಿಸಬಹುದು
GUI ಅನ್ನು ಅರ್ಥಮಾಡಿಕೊಳ್ಳಬಹುದು ಮತ್ತು ಅದರೊಂದಿಗೆ ಸಂವಹನ ನಡೆಸಬಹುದು

"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly

ಇದರರ್ಥ ಇದು "ಚಾಟ್‌ಬಾಟ್" ಅಲ್ಲ, ಆದರೆ "ಕಾರ್ಯ ನಿರ್ವಾಹಕ".

ಸ್ಪರ್ಧಾತ್ಮಕ ಭೂದೃಶ್ಯ

X ನಲ್ಲಿ ಈ ವಾರದ AI ಬಿಡುಗಡೆಗಳನ್ನು ಯಾರೋ ಸಂಕ್ಷಿಪ್ತಗೊಳಿಸಿದ್ದಾರೆ:

"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek

ಚೀನಾದ ಮಾದರಿ ತಯಾರಕರ ಲಯವು ಸ್ಪಷ್ಟವಾಗಿದೆ:

DeepSeek V4
Qwen 3.5
GLM 5
MiniMax 2.5

ಪ್ರತಿ ವಾರ ಹೊಸ ಮಾದರಿಗಳು ಇರುತ್ತವೆ, ಪ್ರತಿಯೊಂದೂ GPT ಅನ್ನು ಸೋಲಿಸಿದೆ ಎಂದು ಹೇಳಿಕೊಳ್ಳುತ್ತದೆ. ಇದು ಮಾರ್ಕೆಟಿಂಗ್ ಅಲ್ಲ, ಇದು ವೆಚ್ಚದ ಯುದ್ಧದ ಉಲ್ಬಣ.

ವೆಚ್ಚದ ರಚನೆ

Qwen 3.5 ರ ಟೋಕನ್ ಬೆಲೆ Gemini 3 Pro ನ 1/18 ಮಾತ್ರ.

"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob

ಕಾರ್ಯಕ್ಷಮತೆ ಹತ್ತಿರವಾದಾಗ ಮತ್ತು ವೆಚ್ಚವು ಕೇವಲ 5% ಆಗಿರುವಾಗ, ಮುಚ್ಚಿದ ಮೂಲ ಮಾದರಿಗಳ ರಕ್ಷಣಾತ್ಮಕ ಗೋಡೆ ಎಲ್ಲಿದೆ?

ಬಾಟಮ್ ಲೈನ್

Qwen 3.5 "ಚೀನಾದ GPT" ಅಲ್ಲ. ಇದು ವೆಚ್ಚದ ರಚನೆಯನ್ನು ಅಡ್ಡಿಪಡಿಸುವಂತಿದೆ:

397B ನಿಯತಾಂಕಗಳು, ಆದರೆ ಕೇವಲ 17B ಅನ್ನು ಸಕ್ರಿಯಗೊಳಿಸಲಾಗಿದೆ
ತೆರೆದ ತೂಕ, ಸ್ಥಳೀಯವಾಗಿ ನಿಯೋಜಿಸಬಹುದು
ಏಜೆಂಟ್ ಸಾಮರ್ಥ್ಯ, ಕೇವಲ ಸಂಭಾಷಣೆಯಲ್ಲ
ವೆಚ್ಚವು ಪ್ರತಿಸ್ಪರ್ಧಿಗಳ 5% ಮಾತ್ರ

X ನಲ್ಲಿ ಒಂದು ಕುತೂಹಲಕಾರಿ ಭವಿಷ್ಯವಿದೆ:

"Qwen 3.5 Q4 ಆವೃತ್ತಿಗೆ ಕೇವಲ 225G ಅಗತ್ಯವಿದೆ, ಇದು ಬಹಳ ಪ್ರಾಯೋಗಿಕ ಮೌಲ್ಯವನ್ನು ಹೊಂದಿದೆ" — @janxin

225GB ಗ್ರಾಫಿಕ್ಸ್ ಮೆಮೊರಿ, ಏಕ ಯಂತ್ರದಲ್ಲಿ ರನ್ ಮಾಡಬಹುದು. ಇದರರ್ಥ ಸಣ್ಣ ಮತ್ತು ಮಧ್ಯಮ ಗಾತ್ರದ ಡೆವಲಪರ್‌ಗಳು GPT-5 ಮಟ್ಟದ ಮಾದರಿಯನ್ನು ಸಂಪರ್ಕಿಸಲು ಸಾಧ್ಯವಾಗುವುದು ಇದೇ ಮೊದಲು.

Qwen 3.5 GPT-5.3 ಅನ್ನು ಸೋಲಿಸಬಹುದೇ ಎಂಬುದು ನಿಜವಾದ ಪ್ರಶ್ನೆಯಲ್ಲ, ಆದರೆ: ಉನ್ನತ ಮಾದರಿಗಳ ವೆಚ್ಚವು ಶೂನ್ಯಕ್ಕೆ ಹತ್ತಿರವಾದಾಗ, AI ಕಂಪನಿಗಳು ಹೇಗೆ ಹಣ ಸಂಪಾದಿಸುತ್ತವೆ?

Qwen 3.5 ಬಿಡುಗಡೆ: 397B ನಿಯತಾಂಕಗಳ ತೆರೆದ ತೂಕದ ಮಾದರಿ, ವೆಚ್ಚದಲ್ಲಿ 60% ಇಳಿಕೆ

ಪ್ರಮುಖ ದತ್ತಾಂಶ

ವಾಸ್ತುಶಿಲ್ಪದ ನಾವೀನ್ಯತೆ

ಕಾರ್ಯಕ್ಷಮತೆಯ ಹೇಳಿಕೆ

ಏಜೆಂಟ್ ಯುಗ

ಸ್ಪರ್ಧಾತ್ಮಕ ಭೂದೃಶ್ಯ

ವೆಚ್ಚದ ರಚನೆ

ಬಾಟಮ್ ಲೈನ್

You Might Also Like

Claude Code Buddy ಪರಿಷ್ಕರಣೆ ಮಾರ್ಗದರ್ಶಿ: ಹೇಗೆ ಹೊಳೆಯುವ ಪುರಾಣ ಮಟ್ಟದ ಪೆಟ್ನನ್ನು ಪಡೆಯುವುದು

Obsidian Defuddle ಅನ್ನು ಬಿಡುಗಡೆ ಮಾಡಿತು, Obsidian ವೆಬ್ ಕ್ಲಿಪ್ಪರ್ ಅನ್ನು ಹೊಸ ಎತ್ತರಕ್ಕೆ ತಂದುಕೊಂಡಿತು

ಅವರು ತೀವ್ರವಾಗಿ ತೂಕ ಕಡಿಮೆ ಮಾಡಲು ಪ್ರಯತ್ನಿಸುತ್ತಿರುವ ತಾಯಿಗಳು, ಖಂಡಿತವಾಗಿ ಇಲ್ಲಿ ಬಿದ್ದಿದ್ದಾರೆ

AI Browser 24 ಗಂಟೆಗಳ ಸ್ಥಿರ ಕಾರ್ಯಾಚರಣೆ ಮಾರ್ಗದರ್ಶಿ