ഷിയു മിനിമാക്സ് M2.5 അവലോകനം

2/14/2026
1 min read

ഷിയു മിനിമാക്സ് M2.5 അവലോകനം\n\nചുരുക്കത്തിൽ: താഴേക്ക് ആഴ്ന്നിറങ്ങുക, മുകളിലേക്ക് വളരുക\n\n## അടിസ്ഥാന വിവരങ്ങൾ\n\nഷിയുവിൻ്റെ മുൻ തലമുറ മോഡലായ M2.1-ൽ സാങ്കേതിക പ്രശ്നങ്ങൾ കാരണം, പ്രോഗ്രാമിംഗിൽ കാര്യമായ പുരോഗതി ഉണ്ടായിട്ടും, ലോജിക്കൽ ശേഷി M2-വിനേക്കാൾ പിന്നിലായിരുന്നു. ഭാഗ്യവശാൽ, M2.5 അടിസ്ഥാനപരമായി സാങ്കേതിക പ്രശ്നങ്ങൾ പരിഹരിച്ചു, കഴിവുകൾ സാധാരണ നിലയിലേക്ക് മടങ്ങി. M2-മായി താരതമ്യപ്പെടുത്തുമ്പോൾ, M2.5 ഏകദേശം 17% പുരോഗതി കൈവരിച്ചു.\n\nഎന്നിരുന്നാലും, ഈ പുരോഗതിയുടെ ഒരു ഭാഗം കൂടുതൽ ദൈർഘ്യമേറിയ ചിന്താ ശൃംഖലയും ആഴത്തിലുള്ള പ്രശ്നപരിഹാര ശേഷിയും ഉപയോഗിച്ച് നേടിയതാണ്. M2.5-ൻ്റെ ശരാശരി ടോക്കൺ ഉപഭോഗം, പരീക്ഷിച്ച എല്ലാ മോഡലുകളിലും ആറാമത്തെ ഉയർന്ന സ്ഥാനത്താണ്, എതിരാളിയായ സോണറ്റിൻ്റെ ഏകദേശം 2 ഇരട്ടി. ഭാഗ്യവശാൽ, ഷിയുവിന് മതിയായ കമ്പ്യൂട്ടിങ് ശേഷിയുണ്ട്, ചെലവും കുറവാണ്. പ്രോഗ്രാമിംഗിൽ സോണറ്റിന് പകരമായി ഉപയോഗിക്കാൻ കഴിയില്ലെങ്കിലും, ദൈനംദിന ഉപയോഗത്തിന് ഇത് പൂർണ്ണമായും ലഭ്യമാണ്. M2.1 ലക്ഷ്യമിട്ട കാര്യങ്ങൾ M2.5 ഒടുവിൽ നേടിയെടുത്തു.\n\n## ലോജിക്കൽ സ്കോറുകൾ\n\nലോജിക്കൽ സ്കോറുകളുടെ പട്ടിക\n\n1 താരതമ്യ ബന്ധം എടുത്തു കാണിക്കാൻ വേണ്ടി, താരതമ്യം ചെയ്യാൻ കഴിയുന്ന മോഡലുകൾ മാത്രമേ പട്ടികയിൽ കാണിച്ചിട്ടുള്ളൂ, ഇത് പൂർണ്ണമായ റാങ്കിംഗല്ല.\n\n2 ചോദ്യങ്ങളും ടെസ്റ്റ് രീതിയും ഇതിൽ കാണുക: വലിയ ഭാഷാ മോഡൽ - ലോജിക്കൽ ശേഷി താരതമ്യ അവലോകനം 26-01 മാസത്തിലെ റാങ്കിംഗ്. #56 ചോദ്യം പുതുതായി ചേർത്തതാണ്.\n\n*3 പൂർണ്ണമായ റാങ്കിംഗ് ലിസ്റ്റ് ഇവിടെ അപ്‌ഡേറ്റ് ചെയ്യും: https://llm2014.github.io/llm_benchmark/\n\n*4 ചുവപ്പ് നിറം ചൈനീസ് പുതുവത്സരത്തെ സൂചിപ്പിക്കുന്നു, സന്തോഷം പ്രകടിപ്പിക്കാൻ വേണ്ടി നൽകിയതാണ്, ഇതിന് മറ്റ് അർത്ഥങ്ങളില്ല.\n\nM2.1-ൽ ഒരു ബഗ് ഉണ്ടായിരുന്നു, അതിനാൽ ലോജിക്കൽ ശേഷി വളരെ കുറവായിരുന്നു. അതിനാൽ താഴെ M2, M2.5 എന്നിവയുടെ താരതമ്യം മാത്രമേ നടത്തുന്നുള്ളൂ.\n\n## മെച്ചപ്പെടുത്തലുകൾ\n\n- സ്ഥിരമായ യുക്തി: M2.5-ന് കൂടുതൽ ദൈർഘ്യമേറിയ യുക്തി പ്രക്രിയയിൽ ആദ്യത്തെ നിബന്ധനകളും സാഹചര്യ വിശദാംശങ്ങളും നിലനിർത്താൻ കഴിയും. അതിനാൽ ഉയർന്ന ബുദ്ധിമുട്ടില്ലാത്തതും എന്നാൽ

Published in Technology

You Might Also Like

如何使用云计算技术:构建您的第一个云基础架构完整指南Technology

如何使用云计算技术:构建您的第一个云基础架构完整指南

如何使用云计算技术:构建您的第一个云基础架构完整指南 引言 ഡിജിറ്റൽ പരിവർത്തനത്തിന്റെ വേഗത കൂടുന്നതിനാൽ, ക്ലൗഡ് കംപ്യൂട്ടിംഗ് സ്ഥാപനങ്ങൾക്കും വികസനക്...

അറിയിപ്പ്! Claude Code-ന്റെ പിതാവ് നേരിട്ട് പറയുന്നു: 1 മാസം കഴിഞ്ഞാൽ Plan Mode ഉപയോഗിക്കേണ്ട, സോഫ്റ്റ്‌വെയർ എഞ്ചിനീയർ തലവാചകം ഇല്ലാതാകുംTechnology

അറിയിപ്പ്! Claude Code-ന്റെ പിതാവ് നേരിട്ട് പറയുന്നു: 1 മാസം കഴിഞ്ഞാൽ Plan Mode ഉപയോഗിക്കേണ്ട, സോഫ്റ്റ്‌വെയർ എഞ്ചിനീയർ തലവാചകം ഇല്ലാതാകും

അറിയിപ്പ്! Claude Code-ന്റെ പിതാവ് നേരിട്ട് പറയുന്നു: 1 മാസം കഴിഞ്ഞാൽ Plan Mode ഉപയോഗിക്കേണ്ട, സോഫ്റ്റ്‌വെയർ എഞ്ചിനീയർ ത...

2026年 Top 10 深度学习资源推荐Technology

2026年 Top 10 深度学习资源推荐

2026年 Top 10 深度学习资源推荐 随着深度学习在各个领域的迅速发展,越来越多的学习资源和工具涌现出来。本文将为您推荐2026年最值得关注的十个深度学习资源,帮助您在这一领域中快速成长。 1. Coursera Deep Learn...

2026年 Top 10 AI 代理:核心卖点解析Technology

2026年 Top 10 AI 代理:核心卖点解析

2026年 Top 10 AI 代理:核心卖点解析 引言 人工智能的 വേഗത്തിൽ വികസനത്തോടെ, AI 代理(AI Agents) സാങ്കേതിക മേഖലയിൽ ഒരു ഹോട്ട് ടോപ്പിക് ആയി മാറി...

2026年 Top 10 AI 工具推荐:释放人工智能的真正潜力Technology

2026年 Top 10 AI 工具推荐:释放人工智能的真正潜力

2026年 Top 10 AI 工具推荐:释放人工智能的真正潜力 在技术飞速发展的今天,人工智能(AI)已成为各行各业的热门话题。从医疗健康到金融服务,从教育到娱乐,AI 工具正在改变我们工作的方式。为此,我们整理出2026年值得关注的十大...

2026年 Top 10 AWS工具和资源推荐Technology

2026年 Top 10 AWS工具和资源推荐

2026年 Top 10 AWS工具和资源推荐 在快速发展的云计算领域,Amazon Web Services (AWS) 一直是领军者,提供丰富的服务和工具,帮助开发者、企业和技术专家在云上有效工作。以下是2026年值得关注的十大AWS工...