ഷിയു മിനിമാക്സ് M2.5 അവലോകനം

2/14/2026
1 min read

ഷിയു മിനിമാക്സ് M2.5 അവലോകനം\n\nചുരുക്കത്തിൽ: താഴേക്ക് ആഴ്ന്നിറങ്ങുക, മുകളിലേക്ക് വളരുക\n\n## അടിസ്ഥാന വിവരങ്ങൾ\n\nഷിയുവിൻ്റെ മുൻ തലമുറ മോഡലായ M2.1-ൽ സാങ്കേതിക പ്രശ്നങ്ങൾ കാരണം, പ്രോഗ്രാമിംഗിൽ കാര്യമായ പുരോഗതി ഉണ്ടായിട്ടും, ലോജിക്കൽ ശേഷി M2-വിനേക്കാൾ പിന്നിലായിരുന്നു. ഭാഗ്യവശാൽ, M2.5 അടിസ്ഥാനപരമായി സാങ്കേതിക പ്രശ്നങ്ങൾ പരിഹരിച്ചു, കഴിവുകൾ സാധാരണ നിലയിലേക്ക് മടങ്ങി. M2-മായി താരതമ്യപ്പെടുത്തുമ്പോൾ, M2.5 ഏകദേശം 17% പുരോഗതി കൈവരിച്ചു.\n\nഎന്നിരുന്നാലും, ഈ പുരോഗതിയുടെ ഒരു ഭാഗം കൂടുതൽ ദൈർഘ്യമേറിയ ചിന്താ ശൃംഖലയും ആഴത്തിലുള്ള പ്രശ്നപരിഹാര ശേഷിയും ഉപയോഗിച്ച് നേടിയതാണ്. M2.5-ൻ്റെ ശരാശരി ടോക്കൺ ഉപഭോഗം, പരീക്ഷിച്ച എല്ലാ മോഡലുകളിലും ആറാമത്തെ ഉയർന്ന സ്ഥാനത്താണ്, എതിരാളിയായ സോണറ്റിൻ്റെ ഏകദേശം 2 ഇരട്ടി. ഭാഗ്യവശാൽ, ഷിയുവിന് മതിയായ കമ്പ്യൂട്ടിങ് ശേഷിയുണ്ട്, ചെലവും കുറവാണ്. പ്രോഗ്രാമിംഗിൽ സോണറ്റിന് പകരമായി ഉപയോഗിക്കാൻ കഴിയില്ലെങ്കിലും, ദൈനംദിന ഉപയോഗത്തിന് ഇത് പൂർണ്ണമായും ലഭ്യമാണ്. M2.1 ലക്ഷ്യമിട്ട കാര്യങ്ങൾ M2.5 ഒടുവിൽ നേടിയെടുത്തു.\n\n## ലോജിക്കൽ സ്കോറുകൾ\n\nലോജിക്കൽ സ്കോറുകളുടെ പട്ടിക\n\n1 താരതമ്യ ബന്ധം എടുത്തു കാണിക്കാൻ വേണ്ടി, താരതമ്യം ചെയ്യാൻ കഴിയുന്ന മോഡലുകൾ മാത്രമേ പട്ടികയിൽ കാണിച്ചിട്ടുള്ളൂ, ഇത് പൂർണ്ണമായ റാങ്കിംഗല്ല.\n\n2 ചോദ്യങ്ങളും ടെസ്റ്റ് രീതിയും ഇതിൽ കാണുക: വലിയ ഭാഷാ മോഡൽ - ലോജിക്കൽ ശേഷി താരതമ്യ അവലോകനം 26-01 മാസത്തിലെ റാങ്കിംഗ്. #56 ചോദ്യം പുതുതായി ചേർത്തതാണ്.\n\n*3 പൂർണ്ണമായ റാങ്കിംഗ് ലിസ്റ്റ് ഇവിടെ അപ്‌ഡേറ്റ് ചെയ്യും: https://llm2014.github.io/llm_benchmark/\n\n*4 ചുവപ്പ് നിറം ചൈനീസ് പുതുവത്സരത്തെ സൂചിപ്പിക്കുന്നു, സന്തോഷം പ്രകടിപ്പിക്കാൻ വേണ്ടി നൽകിയതാണ്, ഇതിന് മറ്റ് അർത്ഥങ്ങളില്ല.\n\nM2.1-ൽ ഒരു ബഗ് ഉണ്ടായിരുന്നു, അതിനാൽ ലോജിക്കൽ ശേഷി വളരെ കുറവായിരുന്നു. അതിനാൽ താഴെ M2, M2.5 എന്നിവയുടെ താരതമ്യം മാത്രമേ നടത്തുന്നുള്ളൂ.\n\n## മെച്ചപ്പെടുത്തലുകൾ\n\n- സ്ഥിരമായ യുക്തി: M2.5-ന് കൂടുതൽ ദൈർഘ്യമേറിയ യുക്തി പ്രക്രിയയിൽ ആദ്യത്തെ നിബന്ധനകളും സാഹചര്യ വിശദാംശങ്ങളും നിലനിർത്താൻ കഴിയും. അതിനാൽ ഉയർന്ന ബുദ്ധിമുട്ടില്ലാത്തതും എന്നാൽ

Published in Technology

You Might Also Like

📝
Technology

Claude Code Buddy മാറ്റം മാർഗ്ഗനിർദ്ദേശം: എങ്ങനെ മിനുക്കിയ പാരമ്പര്യതലത്തെ പെട്ടി നേടാം

Claude Code Buddy മാറ്റം മാർഗ്ഗനിർദ്ദേശം: എങ്ങനെ മിനുക്കിയ പാരമ്പര്യതലത്തെ പെട്ടി നേടാം 2026年4月1日,Anthropic 在 Claude Cod...

Obsidian Defuddle പുറത്തിറക്കി, Obsidian Web Clipper-നെ പുതിയ ഉയരത്തിലേക്ക് കൊണ്ടുപോയിTechnology

Obsidian Defuddle പുറത്തിറക്കി, Obsidian Web Clipper-നെ പുതിയ ഉയരത്തിലേക്ക് കൊണ്ടുപോയി

Obsidian Defuddle പുറത്തിറക്കി, Obsidian Web Clipper-നെ പുതിയ ഉയരത്തിലേക്ക് കൊണ്ടുപോയി ഞാൻ എപ്പോഴും Obsidian-ന്റെ ആധാരഭ...

OpenAI അപ്രതീക്ഷിതമായി "മൂന്ന്-in-ഒന്ന്" പ്രഖ്യാപിച്ചു: ബ്രൗസർ + പ്രോഗ്രാമിംഗ് + ChatGPT സംയോജനം, കഴിഞ്ഞ ഒരു വർഷം തെറ്റായ വഴിയിലേക്കു പോയതായി ആന്തരികമായി അംഗീകരിച്ചുTechnology

OpenAI അപ്രതീക്ഷിതമായി "മൂന്ന്-in-ഒന്ന്" പ്രഖ്യാപിച്ചു: ബ്രൗസർ + പ്രോഗ്രാമിംഗ് + ChatGPT സംയോജനം, കഴിഞ്ഞ ഒരു വർഷം തെറ്റായ വഴിയിലേക്കു പോയതായി ആന്തരികമായി അംഗീകരിച്ചു

OpenAI അപ്രതീക്ഷിതമായി "മൂന്ന്-in-ഒന്ന്" പ്രഖ്യാപിച്ചു: ബ്രൗസർ + പ്രോഗ്രാമിംഗ് + ChatGPT സംയോജനം, കഴിഞ്ഞ ഒരു വർഷം തെറ്റാ...

2026, ഇനി സ്വയം 'ആത്മനിർവഹണം' ചെയ്യാൻ സമ്മർദം നൽകേണ്ട! ഈ 8 ചെറിയ കാര്യങ്ങൾ ചെയ്യുക, ആരോഗ്യവും സ്വാഭാവികമായി വരുംHealth

2026, ഇനി സ്വയം 'ആത്മനിർവഹണം' ചെയ്യാൻ സമ്മർദം നൽകേണ്ട! ഈ 8 ചെറിയ കാര്യങ്ങൾ ചെയ്യുക, ആരോഗ്യവും സ്വാഭാവികമായി വരും

2026, ഇനി സ്വയം 'ആത്മനിർവഹണം' ചെയ്യാൻ സമ്മർദം നൽകേണ്ട! ഈ 8 ചെറിയ കാര്യങ്ങൾ ചെയ്യുക, ആരോഗ്യവും സ്വാഭാവികമായി വരും പുതിയ ...

അവിടെ കുറവായിട്ടും കുറയാത്ത അമ്മമാർ, അവരെ ഇവിടെ കാണാംHealth

അവിടെ കുറവായിട്ടും കുറയാത്ത അമ്മമാർ, അവരെ ഇവിടെ കാണാം

അവിടെ കുറവായിട്ടും കുറയാത്ത അമ്മമാർ, അവരെ ഇവിടെ കാണാം മാർച്ച് മാസത്തിന്റെ മധ്യത്തിൽ, നിങ്ങളുടെ കുറവാക്കൽ പദ്ധതിയേന്താണ്...

📝
Technology

AI Browser 24 മണിക്കൂർ സ്ഥിരമായ പ്രവർത്തന മാർഗ്ഗനിർദ്ദേശം

AI Browser 24 മണിക്കൂർ സ്ഥിരമായ പ്രവർത്തന മാർഗ്ഗനിർദ്ദേശം ഈ ട്യൂട്ടോറിയൽ ഒരു സ്ഥിരമായ, ദീർഘകാല പ്രവർത്തനമുള്ള AI ബ്രൗസർ ...