Qwen 3.5 வெளியீடு: 397B அளவுருக்களுடன் திறந்த எடை மாதிரி, செலவு 60% குறைவு
அலிபாபா இப்போது Qwen 3.5-397B-A17B ஐ வெளியிட்டுள்ளது. இது Qwen 3.5 தொடரின் முதல் திறந்த எடை மாதிரி ஆகும்.
முக்கிய தரவு
- மொத்த அளவுருக்கள்: 397B
- செயல்படுத்தப்பட்ட அளவுருக்கள்: 17B per pass (Sparse MoE)
- உற்பத்தி திறன்: Qwen 3-Max ஐ விட 8.6x-19x அதிகம்
- செலவு: Qwen 3 ஐ விட 60% குறைவு
- மொழி ஆதரவு: 201 (119 இலிருந்து விரிவாக்கப்பட்டது)
இது எளிய அளவுருக்களின் அடுக்கம் அல்ல. இது திறமையின் மறுவரையறை.

கட்டிடக்கலை புதுமை
Qwen 3.5 கலப்பின கட்டிடக்கலையைப் பயன்படுத்துகிறது:
- Gated Delta Networks + Sparse MoE
- கலப்பின நேரியல் கவனம்: பெரும்பாலான அடுக்குகள் நேரியல் கவனத்தைப் பயன்படுத்துகின்றன, ஒவ்வொரு 4 அடுக்குகளும் முழு கவனத்தைப் பயன்படுத்துகின்றன
- உள்நாட்டு பல்லூடக: பின்னர் சேர்க்கப்படவில்லை, ஆனால் ஆரம்பத்திலிருந்து பயிற்சி அளிக்கப்பட்டது
X இல் தொழில்நுட்ப பகுப்பாய்வு உள்ளது:
"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen
இந்த கட்டிடக்கலையின் முக்கியத்துவம் என்னவென்றால்: 17B செயல்படுத்தப்பட்ட அளவுருக்களைப் பயன்படுத்தி 400B மாதிரிக்கு நெருக்கமான செயல்திறனை அடைவது. அனுமானச் செலவு கணிசமாகக் குறைந்துள்ளது.
செயல்திறன் கூற்று
Qwen 3.5 ஐ அலிபாபா வென்றதாகக் கூறுகிறது:
- GPT-5.2
- Claude Opus 4.5
- Gemini 3 Pro
X இல் உள்ள சுயாதீன சோதனையாளர்கள் சரிபார்க்கத் தொடங்குகிறார்கள்:
"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme
ஆனால் மிக முக்கியமான விஷயம் தரப்படுத்தல் சோதனை அல்ல, மாறாக ஏஜென்ட் திறன்:
"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly
ஏஜென்ட் சகாப்தம்
Qwen 3.5 இன் நிலைப்பாடு தெளிவாக உள்ளது: ஏஜென்ட் சகாப்தத்திற்காக வடிவமைக்கப்பட்டது.
- 2 மணி நேர வீடியோவை பகுப்பாய்வு செய்யலாம்
- பயன்பாடுகள் முழுவதும் சுயாதீனமாக பணிகளைச் செய்ய முடியும்
- GUI ஐப் புரிந்து கொண்டு அதனுடன் தொடர்பு கொள்ளலாம்
"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly
இதன் பொருள் இது ஒரு «சாட்போட்» அல்ல, ஆனால் ஒரு «பணி நிறைவேற்றுபவர்».
போட்டி களம்
X இல் இந்த வார AI வெளியீடுகளை யாரோ சுருக்கமாகக் கூறினர்:
"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek
சீன மாதிரி உற்பத்தியாளர்களின் வேகம் தெளிவாக உள்ளது:
- DeepSeek V4
- Qwen 3.5
- GLM 5
- MiniMax 2.5
ஒவ்வொரு வாரமும் புதிய மாதிரிகள் உள்ளன, ஒவ்வொன்றும் GPT ஐ வென்றதாகக் கூறுகின்றன. இது சந்தைப்படுத்தல் அல்ல, இது செலவுப் போரின் அதிகரிப்பு.
செலவு அமைப்பு
Qwen 3.5 இன் டோக்கன் விலை Gemini 3 Pro இன் 1/18 மட்டுமே.
"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob
செயல்திறன் நெருக்கமாக இருக்கும்போது, செலவு 5% மட்டுமே இருக்கும்போது, மூடிய மூல மாதிரிகளின் பாதுகாப்பு எங்கே உள்ளது?
அடிக்கோடு
Qwen 3.5 என்பது «சீன GPT» அல்ல. இது செலவு கட்டமைப்பின் சீர்குலைவு:
- 397B அளவுருக்கள், ஆனால் 17B மட்டுமே செயல்படுத்தப்படுகிறது
- திறந்த எடை, உள்நாட்டில் பயன்படுத்தப்படலாம்
- ஏஜென்ட் திறன், உரையாடல் மட்டுமல்ல
- போட்டியாளர்களை விட 5% மட்டுமே செலவு
X இல் ஒரு சுவாரஸ்யமான கணிப்பு உள்ளது:
"Qwen 3.5 Q4 பதிப்பிற்கு 225G மட்டுமே தேவைப்படும், இது மிகவும் நடைமுறை மதிப்புடையது" — @janxin
225GB வீடியோ நினைவகம், ஒரு இயந்திரத்தில் இயக்க முடியும். இதன் பொருள் சிறு மற்றும் நடுத்தர டெவலப்பர்கள் GPT-5 நிலை மாதிரியை முதன்முறையாக அணுக முடியும்.
உண்மையான கேள்வி Qwen 3.5 GPT-5.3 ஐ வெல்ல முடியுமா என்பது அல்ல, ஆனால்: உயர் மாதிரி செலவு பூஜ்ஜியத்திற்கு அருகில் குறையும்போது, AI நிறுவனங்கள் எவ்வாறு பணம் சம்பாதிப்பது?





