Qwen 3.5 ਜਾਰੀ: 397B ਪੈਰਾਮੀਟਰਾਂ ਵਾਲਾ ਓਪਨ ਵੇਟ ਮਾਡਲ, ਲਾਗਤ 60% ਘੱਟ

ਅਲੀਬਾਬਾ ਨੇ ਹੁਣੇ ਹੀ Qwen 3.5-397B-A17B ਜਾਰੀ ਕੀਤਾ ਹੈ। ਇਹ Qwen 3.5 ਸੀਰੀਜ਼ ਦਾ ਪਹਿਲਾ ਓਪਨ ਵੇਟ ਮਾਡਲ ਹੈ।

ਮੁੱਖ ਡਾਟਾ

ਕੁੱਲ ਪੈਰਾਮੀਟਰ: 397B
ਐਕਟੀਵੇਸ਼ਨ ਪੈਰਾਮੀਟਰ: 17B per pass (ਵਿਰਲੀ MoE)
ਥਰੂਪੁੱਟ: Qwen 3-Max ਨਾਲੋਂ 8.6x-19x ਵੱਧ
ਲਾਗਤ: Qwen 3 ਨਾਲੋਂ 60% ਘੱਟ
ਭਾਸ਼ਾ ਸਹਾਇਤਾ: 201 ਕਿਸਮਾਂ (119 ਕਿਸਮਾਂ ਤੋਂ ਵਧਾਈ ਗਈ)

ਇਹ ਸਿਰਫ਼ ਪੈਰਾਮੀਟਰਾਂ ਦਾ ਢੇਰ ਨਹੀਂ ਹੈ। ਇਹ ਕੁਸ਼ਲਤਾ ਦੀ ਮੁੜ ਪਰਿਭਾਸ਼ਾ ਹੈ।

Qwen 3.5

ਆਰਕੀਟੈਕਚਰ ਨਵੀਨਤਾ

Qwen 3.5 ਇੱਕ ਹਾਈਬ੍ਰਿਡ ਆਰਕੀਟੈਕਚਰ ਵਰਤਦਾ ਹੈ:

Gated Delta Networks + ਵਿਰਲੀ MoE
ਹਾਈਬ੍ਰਿਡ ਲੀਨੀਅਰ ਅਟੈਨਸ਼ਨ: ਜ਼ਿਆਦਾਤਰ ਲੇਅਰ ਲੀਨੀਅਰ ਅਟੈਨਸ਼ਨ ਵਰਤਦੀਆਂ ਹਨ, ਹਰ 4 ਲੇਅਰ ਪੂਰੀ ਅਟੈਨਸ਼ਨ ਵਰਤਦੀਆਂ ਹਨ
ਮੂਲ ਮਲਟੀਮੋਡਲ: ਬਾਅਦ ਵਿੱਚ ਜੋੜਿਆ ਨਹੀਂ ਗਿਆ, ਸਗੋਂ ਸ਼ੁਰੂ ਤੋਂ ਸਿਖਲਾਈ ਦਿੱਤੀ ਗਈ

X 'ਤੇ ਤਕਨੀਕੀ ਵਿਸ਼ਲੇਸ਼ਣ ਹੈ:

"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen

ਇਸ ਆਰਕੀਟੈਕਚਰ ਦਾ ਮਹੱਤਵ ਇਹ ਹੈ: 17B ਐਕਟੀਵੇਸ਼ਨ ਪੈਰਾਮੀਟਰਾਂ ਨਾਲ 400B ਮਾਡਲ ਦੇ ਨੇੜੇ ਪ੍ਰਦਰਸ਼ਨ ਪ੍ਰਾਪਤ ਕਰਨਾ। ਅਨੁਮਾਨ ਲਾਗਤ ਵਿੱਚ ਭਾਰੀ ਗਿਰਾਵਟ ਆਈ ਹੈ।

ਪ੍ਰਦਰਸ਼ਨ ਦਾ ਦਾਅਵਾ

ਅਲੀਬਾਬਾ ਦਾ ਦਾਅਵਾ ਹੈ ਕਿ Qwen 3.5 ਨੇ ਹਰਾਇਆ ਹੈ:

GPT-5.2
Claude Opus 4.5
Gemini 3 Pro

X 'ਤੇ ਸੁਤੰਤਰ ਟੈਸਟਰਾਂ ਨੇ ਤਸਦੀਕ ਕਰਨੀ ਸ਼ੁਰੂ ਕਰ ਦਿੱਤੀ ਹੈ:

"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme

ਪਰ ਸਭ ਤੋਂ ਮਹੱਤਵਪੂਰਨ ਬੈਂਚਮਾਰਕ ਨਹੀਂ ਹੈ, ਸਗੋਂ ਏਜੰਟ ਸਮਰੱਥਾ ਹੈ:

"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly

ਏਜੰਟ ਯੁੱਗ

Qwen 3.5 ਦੀ ਸਥਿਤੀ ਬਹੁਤ ਸਪੱਸ਼ਟ ਹੈ: ਏਜੰਟ ਯੁੱਗ ਲਈ ਡਿਜ਼ਾਈਨ ਕੀਤਾ ਗਿਆ।

2 ਘੰਟੇ ਦੀ ਵੀਡੀਓ ਦਾ ਵਿਸ਼ਲੇਸ਼ਣ ਕਰ ਸਕਦਾ ਹੈ
ਸੁਤੰਤਰ ਤੌਰ 'ਤੇ ਐਪਲੀਕੇਸ਼ਨਾਂ ਵਿੱਚ ਕੰਮ ਕਰ ਸਕਦਾ ਹੈ
GUI ਨੂੰ ਸਮਝ ਸਕਦਾ ਹੈ ਅਤੇ ਇਸ ਨਾਲ ਗੱਲਬਾਤ ਕਰ ਸਕਦਾ ਹੈ

"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly

ਇਸਦਾ ਮਤਲਬ ਹੈ ਕਿ ਇਹ "ਚੈਟਬੋਟ" ਨਹੀਂ ਹੈ, ਸਗੋਂ "ਟਾਸਕ ਐਗਜ਼ੀਕਿਊਟਰ" ਹੈ।

ਮੁਕਾਬਲੇ ਵਾਲਾ ਲੈਂਡਸਕੇਪ

X 'ਤੇ ਕਿਸੇ ਨੇ ਇਸ ਹਫ਼ਤੇ ਦੀ AI ਰਿਲੀਜ਼ ਦਾ ਸਾਰ ਦਿੱਤਾ:

"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek

ਚੀਨੀ ਮਾਡਲ ਨਿਰਮਾਤਾਵਾਂ ਦੀ ਲੈਅ ਬਹੁਤ ਸਪੱਸ਼ਟ ਹੈ:

DeepSeek V4
Qwen 3.5
GLM 5
MiniMax 2.5

ਹਰ ਹਫ਼ਤੇ ਇੱਕ ਨਵਾਂ ਮਾਡਲ ਆਉਂਦਾ ਹੈ, ਹਰ ਵਾਰ GPT ਨੂੰ ਹਰਾਉਣ ਦਾ ਦਾਅਵਾ ਕੀਤਾ ਜਾਂਦਾ ਹੈ। ਇਹ ਮਾਰਕੀਟਿੰਗ ਨਹੀਂ ਹੈ, ਇਹ ਲਾਗਤ ਯੁੱਧ ਦਾ ਵਾਧਾ ਹੈ।

ਲਾਗਤ ਢਾਂਚਾ

Qwen 3.5 ਦੀ ਟੋਕਨ ਕੀਮਤ Gemini 3 Pro ਨਾਲੋਂ ਸਿਰਫ਼ 1/18 ਹੈ।

"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob

ਜਦੋਂ ਪ੍ਰਦਰਸ਼ਨ ਨੇੜੇ ਹੈ, ਅਤੇ ਲਾਗਤ ਸਿਰਫ਼ 5% ਹੈ, ਤਾਂ ਬੰਦ ਸਰੋਤ ਮਾਡਲ ਦੀ ਖਾਈ ਕਿੱਥੇ ਹੈ?

ਹੇਠਲੀ ਲਾਈਨ

Qwen 3.5 "ਚੀਨ ਦਾ GPT" ਨਹੀਂ ਹੈ। ਇਹ ਲਾਗਤ ਢਾਂਚੇ ਦਾ ਵਿਘਨਕਾਰੀ ਹੈ:

397B ਪੈਰਾਮੀਟਰ, ਪਰ ਸਿਰਫ਼ 17B ਨੂੰ ਐਕਟੀਵੇਟ ਕਰੋ
ਓਪਨ ਵੇਟ, ਸਥਾਨਕ ਤੌਰ 'ਤੇ ਤਾਇਨਾਤ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ
ਏਜੰਟ ਸਮਰੱਥਾ, ਸਿਰਫ਼ ਗੱਲਬਾਤ ਨਹੀਂ
ਲਾਗਤ ਮੁਕਾਬਲੇਬਾਜ਼ਾਂ ਨਾਲੋਂ ਸਿਰਫ਼ 5%

X 'ਤੇ ਇੱਕ ਦਿਲਚਸਪ ਭਵਿੱਖਬਾਣੀ ਹੈ:

"Qwen 3.5 Q4 版本只需要 225G，很有实用价值" — @janxin

225GB ਵੀਡੀਓ ਮੈਮੋਰੀ, ਸਿੰਗਲ ਮਸ਼ੀਨ 'ਤੇ ਚੱਲ ਸਕਦੀ ਹੈ। ਇਸਦਾ ਮਤਲਬ ਹੈ ਕਿ ਛੋਟੇ ਅਤੇ ਦਰਮਿਆਨੇ ਆਕਾਰ ਦੇ ਡਿਵੈਲਪਰ ਪਹਿਲੀ ਵਾਰ GPT-5 ਪੱਧਰ ਦੇ ਮਾਡਲ ਦੇ ਨੇੜੇ ਪਹੁੰਚ ਸਕਦੇ ਹਨ।

ਅਸਲ ਸਵਾਲ ਇਹ ਨਹੀਂ ਹੈ ਕਿ ਕੀ Qwen 3.5 GPT-5.3 ਨੂੰ ਹਰਾ ਸਕਦਾ ਹੈ, ਸਗੋਂ ਇਹ ਹੈ: ਜਦੋਂ ਚੋਟੀ ਦੇ ਮਾਡਲਾਂ ਦੀ ਲਾਗਤ ਲਗਭਗ ਜ਼ੀਰੋ ਹੋ ਜਾਂਦੀ ਹੈ, ਤਾਂ AI ਕੰਪਨੀਆਂ ਪੈਸਾ ਕਿਵੇਂ ਕਮਾਉਂਦੀਆਂ ਹਨ?

Qwen 3.5 ਜਾਰੀ: 397B ਪੈਰਾਮੀਟਰਾਂ ਵਾਲਾ ਓਪਨ ਵੇਟ ਮਾਡਲ, ਲਾਗਤ 60% ਘੱਟ

ਮੁੱਖ ਡਾਟਾ

ਆਰਕੀਟੈਕਚਰ ਨਵੀਨਤਾ

ਪ੍ਰਦਰਸ਼ਨ ਦਾ ਦਾਅਵਾ

ਏਜੰਟ ਯੁੱਗ

ਮੁਕਾਬਲੇ ਵਾਲਾ ਲੈਂਡਸਕੇਪ

ਲਾਗਤ ਢਾਂਚਾ

ਹੇਠਲੀ ਲਾਈਨ

You Might Also Like

Claude Code Buddy ਸੋਧ ਗਾਈਡ: ਕਿਵੇਂ ਚਮਕਦਾਰ ਪੁਰਾਣੀ ਪਾਲਤੂ ਪ੍ਰਾਪਤ ਕਰੀਏ

Obsidian ਨੇ Defuddle ਜਾਰੀ ਕੀਤਾ, Obsidian Web Clipper ਨੂੰ ਇੱਕ ਨਵੇਂ ਉੱਚਾਈ 'ਤੇ ਲੈ ਗਿਆ

OpenAI اچانک "تین میں ایک" کا اعلان کرتا ہے: براؤزر + پروگرامنگ + ChatGPT کا انضمام، اندرونی طور پر تسلیم کیا کہ پچھلے سال غلط راستہ اختیار کیا گیا

2026, ਆਪਣੇ ਆਪ ਨੂੰ "ਆਤਮ-ਨਿਯੰਤਰਣ" ਕਰਨ ਲਈ ਦਬਾਉ ਨਾ ਦਿਓ! ਇਹ 8 ਛੋਟੇ ਕੰਮ ਕਰੋ, ਸਿਹਤ ਆਪ ਹੀ ਆਏਗੀ

ਉਹ ਮਾਂਵਾਂ ਜੋ ਵਜ਼ਨ ਘਟਾਉਣ ਲਈ ਕੋਸ਼ਿਸ਼ ਕਰਦੀਆਂ ਹਨ, ਪਰ ਫਿਰ ਵੀ ਘਟ ਨਹੀਂ ਪਾਉਂਦੀਆਂ, ਇਹਨਾਂ ਨੂੰ ਇੱਥੇ ਹੀ ਫਸਣਾ ਪੈਂਦਾ ਹੈ

AI Browser 24 ਘੰਟੇ ਸਥਿਰ ਚਾਲੂ ਰੱਖਣ ਦੀ ਗਾਈਡ