Qwen 3.5 வெளியீடு: 397B அளவுருக்களுடன் திறந்த எடை மாதிரி, செலவு 60% குறைவு

2/16/2026
3 min read

அலிபாபா இப்போது Qwen 3.5-397B-A17B ஐ வெளியிட்டுள்ளது. இது Qwen 3.5 தொடரின் முதல் திறந்த எடை மாதிரி ஆகும்.

முக்கிய தரவு

  • மொத்த அளவுருக்கள்: 397B
  • செயல்படுத்தப்பட்ட அளவுருக்கள்: 17B per pass (Sparse MoE)
  • உற்பத்தி திறன்: Qwen 3-Max ஐ விட 8.6x-19x அதிகம்
  • செலவு: Qwen 3 ஐ விட 60% குறைவு
  • மொழி ஆதரவு: 201 (119 இலிருந்து விரிவாக்கப்பட்டது)

இது எளிய அளவுருக்களின் அடுக்கம் அல்ல. இது திறமையின் மறுவரையறை.

Qwen 3.5

கட்டிடக்கலை புதுமை

Qwen 3.5 கலப்பின கட்டிடக்கலையைப் பயன்படுத்துகிறது:

  • Gated Delta Networks + Sparse MoE
  • கலப்பின நேரியல் கவனம்: பெரும்பாலான அடுக்குகள் நேரியல் கவனத்தைப் பயன்படுத்துகின்றன, ஒவ்வொரு 4 அடுக்குகளும் முழு கவனத்தைப் பயன்படுத்துகின்றன
  • உள்நாட்டு பல்லூடக: பின்னர் சேர்க்கப்படவில்லை, ஆனால் ஆரம்பத்திலிருந்து பயிற்சி அளிக்கப்பட்டது

X இல் தொழில்நுட்ப பகுப்பாய்வு உள்ளது:

"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen

இந்த கட்டிடக்கலையின் முக்கியத்துவம் என்னவென்றால்: 17B செயல்படுத்தப்பட்ட அளவுருக்களைப் பயன்படுத்தி 400B மாதிரிக்கு நெருக்கமான செயல்திறனை அடைவது. அனுமானச் செலவு கணிசமாகக் குறைந்துள்ளது.

செயல்திறன் கூற்று

Qwen 3.5 ஐ அலிபாபா வென்றதாகக் கூறுகிறது:

  • GPT-5.2
  • Claude Opus 4.5
  • Gemini 3 Pro

X இல் உள்ள சுயாதீன சோதனையாளர்கள் சரிபார்க்கத் தொடங்குகிறார்கள்:

"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme

ஆனால் மிக முக்கியமான விஷயம் தரப்படுத்தல் சோதனை அல்ல, மாறாக ஏஜென்ட் திறன்:

"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly

ஏஜென்ட் சகாப்தம்

Qwen 3.5 இன் நிலைப்பாடு தெளிவாக உள்ளது: ஏஜென்ட் சகாப்தத்திற்காக வடிவமைக்கப்பட்டது.

  • 2 மணி நேர வீடியோவை பகுப்பாய்வு செய்யலாம்
  • பயன்பாடுகள் முழுவதும் சுயாதீனமாக பணிகளைச் செய்ய முடியும்
  • GUI ஐப் புரிந்து கொண்டு அதனுடன் தொடர்பு கொள்ளலாம்

"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly

இதன் பொருள் இது ஒரு «சாட்போட்» அல்ல, ஆனால் ஒரு «பணி நிறைவேற்றுபவர்».

போட்டி களம்

X இல் இந்த வார AI வெளியீடுகளை யாரோ சுருக்கமாகக் கூறினர்:

"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek

சீன மாதிரி உற்பத்தியாளர்களின் வேகம் தெளிவாக உள்ளது:

  • DeepSeek V4
  • Qwen 3.5
  • GLM 5
  • MiniMax 2.5

ஒவ்வொரு வாரமும் புதிய மாதிரிகள் உள்ளன, ஒவ்வொன்றும் GPT ஐ வென்றதாகக் கூறுகின்றன. இது சந்தைப்படுத்தல் அல்ல, இது செலவுப் போரின் அதிகரிப்பு.

செலவு அமைப்பு

Qwen 3.5 இன் டோக்கன் விலை Gemini 3 Pro இன் 1/18 மட்டுமே.

"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob

செயல்திறன் நெருக்கமாக இருக்கும்போது, செலவு 5% மட்டுமே இருக்கும்போது, மூடிய மூல மாதிரிகளின் பாதுகாப்பு எங்கே உள்ளது?

அடிக்கோடு

Qwen 3.5 என்பது «சீன GPT» அல்ல. இது செலவு கட்டமைப்பின் சீர்குலைவு:

  1. 397B அளவுருக்கள், ஆனால் 17B மட்டுமே செயல்படுத்தப்படுகிறது
  2. திறந்த எடை, உள்நாட்டில் பயன்படுத்தப்படலாம்
  3. ஏஜென்ட் திறன், உரையாடல் மட்டுமல்ல
  4. போட்டியாளர்களை விட 5% மட்டுமே செலவு

X இல் ஒரு சுவாரஸ்யமான கணிப்பு உள்ளது:

"Qwen 3.5 Q4 பதிப்பிற்கு 225G மட்டுமே தேவைப்படும், இது மிகவும் நடைமுறை மதிப்புடையது" — @janxin

225GB வீடியோ நினைவகம், ஒரு இயந்திரத்தில் இயக்க முடியும். இதன் பொருள் சிறு மற்றும் நடுத்தர டெவலப்பர்கள் GPT-5 நிலை மாதிரியை முதன்முறையாக அணுக முடியும்.

உண்மையான கேள்வி Qwen 3.5 GPT-5.3 ஐ வெல்ல முடியுமா என்பது அல்ல, ஆனால்: உயர் மாதிரி செலவு பூஜ்ஜியத்திற்கு அருகில் குறையும்போது, AI நிறுவனங்கள் எவ்வாறு பணம் சம்பாதிப்பது?

Published in Technology

You Might Also Like

如何使用云计算技术:构建您的第一个云基础架构完整指南Technology

如何使用云计算技术:构建您的第一个云基础架构完整指南

[[HTMLPLACEHOLDER0]] [[HTMLPLACEHOLDER1]] [[HTMLPLACEHOLDER2]] [[HTMLPLACEHOLDER3]] [[HTMLPLACEHOLDER4]] [[HTMLPLACEHOLD...

எச்சரிக்கை! Claude Code-இன் தந்தை நேரடியாக கூறுகிறார்: 1 மாதத்திற்கு பிறகு Plan Mode-ஐ பயன்படுத்த வேண்டாம், மென்பொருள் பொறியாளர் பட்டம் மறைந்து விடும்Technology

எச்சரிக்கை! Claude Code-இன் தந்தை நேரடியாக கூறுகிறார்: 1 மாதத்திற்கு பிறகு Plan Mode-ஐ பயன்படுத்த வேண்டாம், மென்பொருள் பொறியாளர் பட்டம் மறைந்து விடும்

எச்சரிக்கை! Claude Code-இன் தந்தை நேரடியாக கூறுகிறார்: 1 மாதத்திற்கு பிறகு Plan Mode-ஐ பயன்படுத்த வேண்டாம், மென்பொருள் ப...

2026年 Top 10 深度学习资源推荐Technology

2026年 Top 10 深度学习资源推荐

2026年 Top 10 深度学习资源推荐 随着深度学习在各个领域的迅速发展,越来越多的学习资源和工具涌现出来。本文将为您推荐2026年最值得关注的十个深度学习资源,帮助您在这一领域中快速成长。 1. Coursera Deep Learn...

2026年 Top 10 AI 代理:核心卖点解析Technology

2026年 Top 10 AI 代理:核心卖点解析

2026年 Top 10 AI 代理:核心卖点解析 引言 人工智能的 விரைவான வளர்ச்சியுடன், AI 代理 (AI Agents) தொழில்நுட்ப துறையில் ஒரு முக்கியமான தலைப்பாக...

2026ஆம் ஆண்டு Top 10 AI கருவிகள் பரிந்துரை: செயற்கை நுண்ணறிவின் உண்மையான திறனை விடுவிக்கவும்Technology

2026ஆம் ஆண்டு Top 10 AI கருவிகள் பரிந்துரை: செயற்கை நுண்ணறிவின் உண்மையான திறனை விடுவிக்கவும்

2026ஆம் ஆண்டு Top 10 AI கருவிகள் பரிந்துரை: செயற்கை நுண்ணறிவின் உண்மையான திறனை விடுவிக்கவும் தொழில்நுட்பம் வேகமாக வளர்ந்...

2026年 Top 10 AWS工具和资源推荐Technology

2026年 Top 10 AWS工具和资源推荐

2026年 Top 10 AWS工具和资源推荐 在快速发展的云计算领域,Amazon Web Services (AWS) 一直是领军者,提供丰富的服务和工具,帮助开发者、企业和技术专家在云上有效工作。以下是2026年值得关注的十大AWS工...