ഷിയു മിനിമാക്സ് M2.5 അവലോകനം
2/14/2026
1 min read
ഷിയു മിനിമാക്സ് M2.5 അവലോകനം\n\nചുരുക്കത്തിൽ: താഴേക്ക് ആഴ്ന്നിറങ്ങുക, മുകളിലേക്ക് വളരുക\n\n## അടിസ്ഥാന വിവരങ്ങൾ\n\nഷിയുവിൻ്റെ മുൻ തലമുറ മോഡലായ M2.1-ൽ സാങ്കേതിക പ്രശ്നങ്ങൾ കാരണം, പ്രോഗ്രാമിംഗിൽ കാര്യമായ പുരോഗതി ഉണ്ടായിട്ടും, ലോജിക്കൽ ശേഷി M2-വിനേക്കാൾ പിന്നിലായിരുന്നു. ഭാഗ്യവശാൽ, M2.5 അടിസ്ഥാനപരമായി സാങ്കേതിക പ്രശ്നങ്ങൾ പരിഹരിച്ചു, കഴിവുകൾ സാധാരണ നിലയിലേക്ക് മടങ്ങി. M2-മായി താരതമ്യപ്പെടുത്തുമ്പോൾ, M2.5 ഏകദേശം 17% പുരോഗതി കൈവരിച്ചു.\n\nഎന്നിരുന്നാലും, ഈ പുരോഗതിയുടെ ഒരു ഭാഗം കൂടുതൽ ദൈർഘ്യമേറിയ ചിന്താ ശൃംഖലയും ആഴത്തിലുള്ള പ്രശ്നപരിഹാര ശേഷിയും ഉപയോഗിച്ച് നേടിയതാണ്. M2.5-ൻ്റെ ശരാശരി ടോക്കൺ ഉപഭോഗം, പരീക്ഷിച്ച എല്ലാ മോഡലുകളിലും ആറാമത്തെ ഉയർന്ന സ്ഥാനത്താണ്, എതിരാളിയായ സോണറ്റിൻ്റെ ഏകദേശം 2 ഇരട്ടി. ഭാഗ്യവശാൽ, ഷിയുവിന് മതിയായ കമ്പ്യൂട്ടിങ് ശേഷിയുണ്ട്, ചെലവും കുറവാണ്. പ്രോഗ്രാമിംഗിൽ സോണറ്റിന് പകരമായി ഉപയോഗിക്കാൻ കഴിയില്ലെങ്കിലും, ദൈനംദിന ഉപയോഗത്തിന് ഇത് പൂർണ്ണമായും ലഭ്യമാണ്. M2.1 ലക്ഷ്യമിട്ട കാര്യങ്ങൾ M2.5 ഒടുവിൽ നേടിയെടുത്തു.\n\n## ലോജിക്കൽ സ്കോറുകൾ\n\n
\n\n1 താരതമ്യ ബന്ധം എടുത്തു കാണിക്കാൻ വേണ്ടി, താരതമ്യം ചെയ്യാൻ കഴിയുന്ന മോഡലുകൾ മാത്രമേ പട്ടികയിൽ കാണിച്ചിട്ടുള്ളൂ, ഇത് പൂർണ്ണമായ റാങ്കിംഗല്ല.\n\n2 ചോദ്യങ്ങളും ടെസ്റ്റ് രീതിയും ഇതിൽ കാണുക: വലിയ ഭാഷാ മോഡൽ - ലോജിക്കൽ ശേഷി താരതമ്യ അവലോകനം 26-01 മാസത്തിലെ റാങ്കിംഗ്. #56 ചോദ്യം പുതുതായി ചേർത്തതാണ്.\n\n*3 പൂർണ്ണമായ റാങ്കിംഗ് ലിസ്റ്റ് ഇവിടെ അപ്ഡേറ്റ് ചെയ്യും: https://llm2014.github.io/llm_benchmark/\n\n*4 ചുവപ്പ് നിറം ചൈനീസ് പുതുവത്സരത്തെ സൂചിപ്പിക്കുന്നു, സന്തോഷം പ്രകടിപ്പിക്കാൻ വേണ്ടി നൽകിയതാണ്, ഇതിന് മറ്റ് അർത്ഥങ്ങളില്ല.\n\nM2.1-ൽ ഒരു ബഗ് ഉണ്ടായിരുന്നു, അതിനാൽ ലോജിക്കൽ ശേഷി വളരെ കുറവായിരുന്നു. അതിനാൽ താഴെ M2, M2.5 എന്നിവയുടെ താരതമ്യം മാത്രമേ നടത്തുന്നുള്ളൂ.\n\n## മെച്ചപ്പെടുത്തലുകൾ\n\n- സ്ഥിരമായ യുക്തി: M2.5-ന് കൂടുതൽ ദൈർഘ്യമേറിയ യുക്തി പ്രക്രിയയിൽ ആദ്യത്തെ നിബന്ധനകളും സാഹചര്യ വിശദാംശങ്ങളും നിലനിർത്താൻ കഴിയും. അതിനാൽ ഉയർന്ന ബുദ്ധിമുട്ടില്ലാത്തതും എന്നാൽ
Published in Technology





