Qwen 3.5 રિલીઝ: 397B પરિમાણોનું ઓપન વેઇટ મોડેલ, ખર્ચમાં 60% ઘટાડો

અલીબાબાએ હમણાં જ Qwen 3.5-397B-A17B રિલીઝ કર્યું છે. આ Qwen 3.5 શ્રેણીનું પ્રથમ ઓપન વેઇટ મોડેલ છે.

મુખ્ય ડેટા

કુલ પરિમાણો: 397B
સક્રિય પરિમાણો: 17B per pass (સ્પાર્સ MoE)
થ્રુપુટ: Qwen 3-Max કરતાં 8.6x-19x વધારે
ખર્ચ: Qwen 3 કરતાં 60% ઓછો
ભાષા સપોર્ટ: 201 (119 થી વિસ્તૃત)

આ માત્ર પરિમાણોનો ઢગલો નથી. આ કાર્યક્ષમતાની પુનઃવ્યાખ્યા છે.

Qwen 3.5

આર્કિટેક્ચરલ ઇનોવેશન

Qwen 3.5 હાઇબ્રિડ આર્કિટેક્ચરનો ઉપયોગ કરે છે:

Gated Delta Networks + સ્પાર્સ MoE
હાઇબ્રિડ લીનિયર એટેન્શન: મોટાભાગના સ્તરો લીનિયર એટેન્શનનો ઉપયોગ કરે છે, દરેક 4 સ્તરો સંપૂર્ણ એટેન્શનનો ઉપયોગ કરે છે
મૂળ મલ્ટીમોડલ: પછીથી ઉમેરવામાં આવેલ નથી, પરંતુ શરૂઆતથી તાલીમ પામેલ છે

X પર તકનીકી વિશ્લેષણ છે:

"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen

આ આર્કિટેક્ચરનો અર્થ એ છે કે: 17B સક્રિય પરિમાણો સાથે 400B મોડેલની નજીકની કામગીરી પ્રાપ્ત કરવી. અનુમાન ખર્ચમાં નોંધપાત્ર ઘટાડો થયો છે.

કામગીરીનો દાવો

અલીબાબાએ દાવો કર્યો છે કે Qwen 3.5 એ હરાવ્યું છે:

GPT-5.2
Claude Opus 4.5
Gemini 3 Pro

X પર સ્વતંત્ર પરીક્ષકોએ ચકાસણી શરૂ કરી:

"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme

પરંતુ સૌથી મહત્વપૂર્ણ બેન્ચમાર્ક નથી, પરંતુ એજન્ટ ક્ષમતા છે:

"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly

એજન્ટ યુગ

Qwen 3.5 ની સ્થિતિ સ્પષ્ટ છે: એજન્ટ યુગ માટે ડિઝાઇન કરવામાં આવી છે.

2 કલાકના વીડિયોનું વિશ્લેષણ કરી શકે છે
એપ્લિકેશન કાર્યોને સ્વતંત્ર રીતે પાર પાડી શકે છે
GUI ને સમજી શકે છે અને તેની સાથે ક્રિયાપ્રતિક્રિયા કરી શકે છે

"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly

આનો અર્થ એ છે કે તે "ચેટબોટ" નથી, પરંતુ "ટાસ્ક એક્ઝિક્યુટર" છે.

સ્પર્ધાત્મક લેન્ડસ્કેપ

X પર કોઈએ આ અઠવાડિયાની AI રિલીઝનો સારાંશ આપ્યો:

"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek

ચાઇનીઝ મોડેલ ઉત્પાદકોની લય સ્પષ્ટ છે:

DeepSeek V4
Qwen 3.5
GLM 5
MiniMax 2.5

દર અઠવાડિયે એક નવું મોડેલ આવે છે, અને દરેક વખતે GPT ને હરાવવાનો દાવો કરવામાં આવે છે. આ માર્કેટિંગ નથી, આ ખર્ચ યુદ્ધનું અપગ્રેડ છે.

ખર્ચ માળખું

Qwen 3.5 ની ટોકન કિંમત Gemini 3 Pro ની માત્ર 1/18 છે.

"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob

જ્યારે કામગીરી નજીક હોય અને ખર્ચ માત્ર 5% હોય, તો બંધ સ્ત્રોત મોડેલનો ગઢ ક્યાં છે?

બોટમ લાઇન

Qwen 3.5 એ "ચાઇનાનું GPT" નથી. તે ખર્ચ માળખાનો વિક્ષેપકારક છે:

397B પરિમાણો, પરંતુ માત્ર 17B સક્રિય છે
ઓપન વેઇટ, સ્થાનિક રીતે જમાવી શકાય છે
એજન્ટ ક્ષમતા, માત્ર વાતચીત જ નહીં
ખર્ચ હરીફોના માત્ર 5%

X પર એક રસપ્રદ આગાહી છે:

"Qwen 3.5 Q4 વર્ઝનને માત્ર 225G ની જરૂર છે, જે ખૂબ જ વ્યવહારુ છે" — @janxin

225GB વિડીયો મેમરી, એક જ મશીન પર ચાલી શકે છે. આનો અર્થ એ છે કે નાના અને મધ્યમ કદના વિકાસકર્તાઓ પ્રથમ વખત GPT-5 સ્તરની નજીકના મોડેલનો સંપર્ક કરી શકશે.

વાસ્તવિક પ્રશ્ન એ નથી કે Qwen 3.5 GPT-5.3 ને હરાવી શકે છે કે નહીં, પરંતુ: જ્યારે ટોચના મોડેલનો ખર્ચ લગભગ શૂન્ય થઈ જાય છે, ત્યારે AI કંપનીઓ કેવી રીતે પૈસા કમાય છે?

Qwen 3.5 રિલીઝ: 397B પરિમાણોનું ઓપન વેઇટ મોડેલ, ખર્ચમાં 60% ઘટાડો

મુખ્ય ડેટા

આર્કિટેક્ચરલ ઇનોવેશન

કામગીરીનો દાવો

એજન્ટ યુગ

સ્પર્ધાત્મક લેન્ડસ્કેપ

ખર્ચ માળખું

બોટમ લાઇન

You Might Also Like

Claude Code Buddy સુધારણા માર્ગદર્શિકા: કેવી રીતે મેળવો ચમકદાર દંતકથા સ્તરની પેટે

Obsidian એ Defuddle રજૂ કર્યું, Obsidian Web Clipper ને નવા ઊંચાઈ પર લઈ ગયું

2026, હવે પોતાને "આપણી" કરવા માટે દબાણ ન કરો! આ 8 નાનકડી બાબતો કરો, સ્વાસ્થ્ય સ્વાભાવિક રીતે આવશે

努力 વજન ઘટાડવા છતાં વજન ઘટાડવા ન શકતા માતાઓ, ચોક્કસપણે અહીં જ પડી ગયા છે

AI Browser 24 કલાક સ્થિર કાર્યરત માર્ગદર્શિકા