稀宇 MiniMax M2.5 समीक्षा
2/14/2026
2 min read
稀宇 MiniMax M2.5 समीक्षा\n\nसंक्षिप्त निष्कर्ष: नीचे जड़ें जमाना, ऊपर बढ़ना\n\n## बुनियादी स्थिति\n\n稀宇 की पिछली पीढ़ी M2.1 तकनीकी समस्याओं के कारण, हालांकि प्रोग्रामिंग में उल्लेखनीय प्रगति हुई, लेकिन तार्किक क्षमता M2 से पीछे रह गई। अच्छी बात यह है कि M2.5 ने मूल रूप से तकनीकी समस्याओं का समाधान कर लिया है, और क्षमता सामान्य ट्रैक पर वापस आ गई है। M2 की तुलना में, M2.5 में लगभग 17% की प्रगति हुई है।\n\nहालांकि, कुछ प्रगति लंबी विचार श्रृंखला और समाधान स्थान की गहरी खोज के माध्यम से प्राप्त की गई है। M2.5 की औसत टोकन खपत परीक्षण किए जा रहे सभी मॉडलों में छठे स्थान पर है, जो प्रतिद्वंद्वी Sonnet की लगभग दोगुनी है। अच्छी बात यह है कि 稀宇 की कंप्यूटिंग शक्ति की गारंटी है, और लागत भी अधिक नहीं है। हालांकि प्रोग्रामिंग Sonnet के लिए बिना किसी कमी के प्रतिस्थापन नहीं कर सकती है, लेकिन दैनिक उपयोग के लिए यह पूरी तरह से उपलब्ध है। M2.5 ने अंततः उस लक्ष्य को प्राप्त कर लिया जिसे M2.1 प्राप्त करना चाहता था।\n\n## तार्किक अंक\n\n
\n\n1 तालिका में तुलनात्मक संबंध को उजागर करने के लिए, केवल कुछ तुलनात्मक मॉडल प्रदर्शित किए गए हैं, यह पूर्ण क्रम नहीं है।\n\n2 प्रश्न और परीक्षण विधियों के लिए, देखें: बड़ी भाषा मॉडल - तार्किक क्षमता क्षैतिज मूल्यांकन 26-01 मासिक रैंकिंग। #56 प्रश्न जोड़ा गया।\n\n3 पूर्ण रैंकिंग https://llm2014.github.io/llm_benchmark/ पर अपडेट की गई है\n\n4 लाल रंग वसंत महोत्सव की अवधि तक सीमित है, जो खुशी का प्रतीक है, इसका कोई अन्य अर्थ नहीं है।\n\nचूंकि M2.1 एक बग वाला संस्करण है, और तार्किक क्षमता असामान्य रूप से कम है, इसलिए निम्नलिखित पाठ केवल M2 और M2.5 की अंतर-पीढ़ी तुलना करेगा।\n\n## सुधार\n\n- स्थिर अनुमान: M2.5 लंबी अनुमान प्रक्रिया के दौरान प्रारंभिक बाधाओं और प्रासंगिक विवरणों को बनाए रख सकता है, इसलिए कुछ ऐसी समस्याएं जो मुश्किल नहीं हैं, लेकिन
Published in Technology





