Qwen 3.5 പുറത്തിറക്കി: 397B പാരാമീറ്ററുകളുള്ള ഓപ്പൺ വെയ്റ്റ് മോഡൽ, ചെലവ് 60% കുറഞ്ഞു

2/16/2026
3 min read

അലിബാബ ഇപ്പോൾ Qwen 3.5-397B-A17B പുറത്തിറക്കി. Qwen 3.5 സീരീസിലെ ആദ്യത്തെ ഓപ്പൺ വെയ്റ്റ് മോഡലാണിത്.

പ്രധാന ഡാറ്റ

  • ആകെ പാരാമീറ്ററുകൾ: 397B
  • സജീവമാക്കിയ പാരാമീറ്ററുകൾ: 17B per pass (Sparse MoE)
  • ത്രൂപുട്ട്: Qwen 3-Max നെക്കാൾ 8.6x-19x മെച്ചം
  • ചെലവ്: Qwen 3 നെക്കാൾ 60% കുറവ്
  • ഭാഷാ പിന്തുണ: 201 എണ്ണം (119 എണ്ണത്തിൽ നിന്ന് വികസിപ്പിച്ചു)

ഇതൊരു സാധാരണ പാരാമീറ്റർ അടുക്കൽ അല്ല. ഇത് കാര്യക്ഷമതയുടെ പുനർനിർവചനമാണ്.

Qwen 3.5

ആർക്കിടെക്ചർ ഇന്നൊവേഷൻ

Qwen 3.5 ഒരു ഹൈബ്രിഡ് ആർക്കിടെക്ചർ ഉപയോഗിക്കുന്നു:

  • Gated Delta Networks + Sparse MoE
  • ഹൈബ്രിഡ് ലീനിയർ അറ്റൻഷൻ: മിക്ക ലെയറുകളും ലീനിയർ അറ്റൻഷൻ ഉപയോഗിക്കുന്നു, ഓരോ 4 ലെയറിലും ഫുൾ അറ്റൻഷൻ ഉപയോഗിക്കുന്നു
  • നേറ്റീവ് മൾട്ടിമോഡൽ: പിന്നീട് ചേർത്തതല്ല, ആദ്യം മുതലേ പരിശീലനം നൽകിയത്

X-ൽ സാങ്കേതിക വിശകലനം ഉണ്ട്:

"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen

ഈ ആർക്കിടെക്ചറിൻ്റെ പ്രാധാന്യം ഇതാണ്: 17B സജീവമാക്കിയ പാരാമീറ്ററുകൾ ഉപയോഗിച്ച് 400B മോഡലിൻ്റെ പ്രകടനം നേടുന്നു. അനുമാനത്തിനുള്ള (Inference) ചെലവ് ഗണ്യമായി കുറയുന്നു.

പ്രകടന അവകാശവാദങ്ങൾ

Qwen 3.5 ഇതിനെക്കാളൊക്കെ മികച്ചതാണെന്ന് അലിബാബ അവകാശപ്പെടുന്നു:

  • GPT-5.2
  • Claude Opus 4.5
  • Gemini 3 Pro

X-ലെ സ്വതന്ത്ര ടെസ്റ്റർമാർ ഇത് ശരിയാണോ എന്ന് പരിശോധിക്കാൻ തുടങ്ങി:

"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme

എന്നാൽ ഏറ്റവും പ്രധാനപ്പെട്ട കാര്യം ബെഞ്ച്മാർക്ക് ടെസ്റ്റുകളല്ല, മറിച്ച് ഏജൻ്റ് ശേഷിയാണ്:

"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly

ഏജൻ്റ് യുഗം

Qwen 3.5-ൻ്റെ ലക്ഷ്യം വ്യക്തമാണ്: ഏജൻ്റ് യുഗത്തിനായി രൂപകൽപ്പന ചെയ്തത്.

  • 2 മണിക്കൂർ വീഡിയോ വിശകലനം ചെയ്യാൻ കഴിയും
  • ആപ്ലിക്കേഷനുകൾക്കിടയിൽ സ്വതന്ത്രമായി ടാസ്‌ക്കുകൾ ചെയ്യാൻ കഴിയും
  • GUI മനസ്സിലാക്കാനും അതിൽ ഇടപെടാനും കഴിയും

"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly

ഇതിനർത്ഥം ഇതൊരു 'ചാറ്റ്ബോട്ട്' അല്ല, മറിച്ച് 'ടാസ്‌ക് എക്സിക്യൂട്ടർ' ആണ്.

മത്സര രംഗം

X-ൽ ഈ ആഴ്ചയിലെ AI റിലീസുകളെക്കുറിച്ച് ഒരാൾ സംഗ്രഹിച്ചു:

"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek

ചൈനീസ് മോഡൽ നിർമ്മാതാക്കളുടെ രീതി വ്യക്തമാണ്:

  • DeepSeek V4
  • Qwen 3.5
  • GLM 5
  • MiniMax 2.5

ഓരോ ആഴ്ചയിലും പുതിയ മോഡലുകൾ പുറത്തിറങ്ങുന്നു, ഓരോ തവണയും GPT-യെക്കാൾ മികച്ചതാണെന്ന് അവകാശപ്പെടുന്നു. ഇതൊരു മാർക്കറ്റിംഗ് തന്ത്രമല്ല, മറിച്ച് ചെലവ് കുറഞ്ഞ മോഡലുകൾ തമ്മിലുള്ള മത്സരത്തിൻ്റെ വളർച്ചയാണ്.

ചെലവ് ഘടന

Qwen 3.5-ൻ്റെ ടോക്കൺ വില Gemini 3 Pro-യുടെ 1/18 മാത്രമാണ്.

"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob

പ്രകടനം ഏകദേശം തുല്യവും ചെലവ് 5% മാത്രം ആകുമ്പോൾ, സ്വകാര്യ മോഡലുകളുടെ സംരക്ഷണം എവിടെയാണ്?

അടിവരയിടുന്നു

Qwen 3.5 ഒരു 'ചൈനീസ് GPT' അല്ല. ഇത് ചെലവ് ഘടനയെ തകിടം മറിക്കുന്ന ഒന്നാണ്:

  1. 397B പാരാമീറ്ററുകൾ, പക്ഷേ 17B മാത്രമേ സജീവമാകൂ
  2. ഓപ്പൺ വെയ്റ്റ്, പ്രാദേശികമായി ഉപയോഗിക്കാൻ കഴിയും
  3. ഏജൻ്റ് ശേഷി, സംഭാഷണത്തിന് മാത്രമല്ല
  4. എതിരാളികളേക്കാൾ 5% മാത്രം ചെലവ്

X-ൽ രസകരമായ ഒരു പ്രവചനമുണ്ട്:

"Qwen 3.5 Q4 പതിപ്പിന് 225G മാത്രമേ ആവശ്യമുള്ളൂ, വളരെ പ്രായോഗികമാണ്" — @janxin

225GB വീഡിയോ മെമ്മറി, ഒരു കമ്പ്യൂട്ടറിൽ പ്രവർത്തിപ്പിക്കാൻ കഴിയും. ഇതിനർത്ഥം ചെറുകിട ഡെവലപ്പർമാർക്ക് GPT-5 ലെവലിലുള്ള മോഡലുകൾ ആദ്യമായി ഉപയോഗിക്കാൻ കഴിയും എന്നാണ്.

Qwen 3.5-ന് GPT-5.3 നെ മറികടക്കാൻ കഴിയുമോ എന്നതല്ല യഥാർത്ഥ ചോദ്യം, മറിച്ച് മികച്ച മോഡലുകളുടെ ചെലവ് പൂജ്യത്തിന് അടുത്തേക്ക് എത്തുമ്പോൾ, AI കമ്പനികൾ എങ്ങനെ പണം സമ്പാദിക്കും എന്നതാണ്?

Published in Technology

You Might Also Like

如何使用云计算技术:构建您的第一个云基础架构完整指南Technology

如何使用云计算技术:构建您的第一个云基础架构完整指南

如何使用云计算技术:构建您的第一个云基础架构完整指南 引言 ഡിജിറ്റൽ പരിവർത്തനത്തിന്റെ വേഗത കൂടുന്നതിനാൽ, ക്ലൗഡ് കംപ്യൂട്ടിംഗ് സ്ഥാപനങ്ങൾക്കും വികസനക്...

അറിയിപ്പ്! Claude Code-ന്റെ പിതാവ് നേരിട്ട് പറയുന്നു: 1 മാസം കഴിഞ്ഞാൽ Plan Mode ഉപയോഗിക്കേണ്ട, സോഫ്റ്റ്‌വെയർ എഞ്ചിനീയർ തലവാചകം ഇല്ലാതാകുംTechnology

അറിയിപ്പ്! Claude Code-ന്റെ പിതാവ് നേരിട്ട് പറയുന്നു: 1 മാസം കഴിഞ്ഞാൽ Plan Mode ഉപയോഗിക്കേണ്ട, സോഫ്റ്റ്‌വെയർ എഞ്ചിനീയർ തലവാചകം ഇല്ലാതാകും

അറിയിപ്പ്! Claude Code-ന്റെ പിതാവ് നേരിട്ട് പറയുന്നു: 1 മാസം കഴിഞ്ഞാൽ Plan Mode ഉപയോഗിക്കേണ്ട, സോഫ്റ്റ്‌വെയർ എഞ്ചിനീയർ ത...

2026年 Top 10 深度学习资源推荐Technology

2026年 Top 10 深度学习资源推荐

2026年 Top 10 深度学习资源推荐 随着深度学习在各个领域的迅速发展,越来越多的学习资源和工具涌现出来。本文将为您推荐2026年最值得关注的十个深度学习资源,帮助您在这一领域中快速成长。 1. Coursera Deep Learn...

2026年 Top 10 AI 代理:核心卖点解析Technology

2026年 Top 10 AI 代理:核心卖点解析

2026年 Top 10 AI 代理:核心卖点解析 引言 人工智能的 വേഗത്തിൽ വികസനത്തോടെ, AI 代理(AI Agents) സാങ്കേതിക മേഖലയിൽ ഒരു ഹോട്ട് ടോപ്പിക് ആയി മാറി...

2026年 Top 10 AI 工具推荐:释放人工智能的真正潜力Technology

2026年 Top 10 AI 工具推荐:释放人工智能的真正潜力

2026年 Top 10 AI 工具推荐:释放人工智能的真正潜力 在技术飞速发展的今天,人工智能(AI)已成为各行各业的热门话题。从医疗健康到金融服务,从教育到娱乐,AI 工具正在改变我们工作的方式。为此,我们整理出2026年值得关注的十大...

2026年 Top 10 AWS工具和资源推荐Technology

2026年 Top 10 AWS工具和资源推荐

2026年 Top 10 AWS工具和资源推荐 在快速发展的云计算领域,Amazon Web Services (AWS) 一直是领军者,提供丰富的服务和工具,帮助开发者、企业和技术专家在云上有效工作。以下是2026年值得关注的十大AWS工...