MiniMax M2.5 का परीक्षण करने के बाद, मुझे संदेह होने लगा कि क्या मुझे Claude को नवीनीकृत करना चाहिए...
MiniMax M2.5 आ गया है! मैंने तुरंत Claude Code से जुड़कर इसका परीक्षण किया।
इस बार यह वास्तव में अलग है, MiniMax द्वारा आधिकारिक तौर पर घोषित परिणाम काफी प्रभावशाली हैं।
SWE-Bench Verified ने 80.2% प्राप्त किया, Multi-SWE-Bench बहुभाषी प्रोग्रामिंग में सीधे पहला स्थान प्राप्त किया, BrowseComp खोज क्षमता भी 76.3% के SOTA स्तर पर है।
OpenClaw के संस्थापक Peter Steinberger ने पहले एक साक्षात्कार में MiniMax श्रृंखला के मॉडल की कई बार सिफारिश की थी, इस बार M2.5 के आने पर उन्होंने सीधे एक पोस्ट को रीपोस्ट किया:
"MiniMax ने अभी MiniMaxM2.5 जारी किया है, इसका प्रदर्शन Opus4.6 के बराबर है, और कीमत 20 गुना सस्ती है!"
मैं वास्तव में सभी को स्वयं प्रयास करने की पुरजोर सिफारिश करना चाहता हूं, M2.5 पूरी तरह से डेवलपर्स के लिए एक वरदान है, इसकी विकास क्षमता बहुत मजबूत है!
M2.5 का उपयोग करने के बाद, मुझे संदेह होने लगा कि क्या अगले महीने Claude को नवीनीकृत करना आवश्यक होगा……

मुख्य लाभ
M2.5 का सौंदर्यशास्त्र और पूर्णता बहुत अधिक है, खासकर कुछ बहुत जटिल विकास आवश्यकताओं को संभालने में यह माहिर है। हर कोई थोड़ी देर में मेरा दूसरा मामला देख सकता है, यह बहुत अच्छी तरह से पूरा हुआ, उस समय इसमें लगभग 20 मिनट लगे।
आधिकारिक तौर पर MiniMax M2.5 को इंटेलिजेंट एजेंट मूल आर्किटेक्चर कहा जाता है, दूसरे शब्दों में, यह मॉडल स्वाभाविक रूप से काम करने के लिए बना है।
इसकी सक्रिय पैरामीटर मात्रा केवल 10B है, तुलनात्मक रूप से, Claude Opus 4 जैसे प्रमुख मॉडल में सैकड़ों B पैरामीटर होते हैं। लेकिन M2.5 प्रोग्रामिंग, दस्तावेज़ प्रसंस्करण और जटिल कार्य निष्पादन जैसे क्षेत्रों में शीर्ष प्रमुख मॉडलों के साथ प्रतिस्पर्धा करने में सक्षम है।
संयोग से, मैंने हाल ही में देखा कि मेरे आसपास के कई दोस्त कुछ वेबसाइट विकास परियोजनाओं या व्यावसायिक प्लेटफार्मों को करते समय आउटसोर्सिंग के लिए पैसे खर्च करते हैं।
लेकिन मुझे कहना होगा कि MiniMax M2.5 ये सभी काम कर सकता है, और प्रभाव कई ऑनलाइन प्लेटफार्मों से कम नहीं है……
मैंने 3 परीक्षण परिदृश्य चलाए, जिसमें व्यक्तिगत वेबसाइट विकास, वाणिज्यिक प्लेटफ़ॉर्म निर्माण और ऑनलाइन शिक्षा प्लेटफ़ॉर्म निर्माण शामिल हैं, आइए देखें कि MiniMax M2.5 का वास्तविक प्रभाव कैसा है👇
वास्तविक मामले
Case 1: एक सौंदर्य ब्लॉगर एक व्यक्तिगत ब्रांड वेबसाइट बनाना चाहता है
कुछ समय पहले, एक सौंदर्य स्व-मीडिया मित्र ने मुझसे सलाह ली, उसने कहा कि वह अपनी कुछ सोशल मीडिया कृतियों को प्रदर्शित करने के लिए AI के साथ एक व्यक्तिगत वेबसाइट बनाना चाहती है, ताकि पार्टी ए को देखना आसान हो।
लेकिन वह खुद कोड बिल्कुल नहीं समझती है, और बाहर आउटसोर्सिंग उद्धरण हजारों से शुरू होते हैं।
इस आवश्यकता के आधार पर, मैं यह देखने की कोशिश करना चाहता था कि क्या मैं सीधे MiniMax M2.5 का उपयोग एक ही बार में कर सकता हूं।
इसने पहले पूरी वेबसाइट के तकनीकी स्टैक और निर्देशिका संरचना की योजना बनाई, और फिर एक-एक करके पृष्ठों के लिए कोड उत्पन्न करना शुरू कर दिया।
कुछ स्थानों पर यह सक्रिय रूप से अनुकूलन करेगा, जैसे कि मोबाइल टर्मिनल पर झरना प्रवाह की कॉलम संख्या को स्वचालित रूप से समायोजित करना, और ढाल पृष्ठभूमि में एक चिकनी संक्रमण एनीमेशन जोड़ना।
पूरी प्रक्रिया में केवल तीन मिनट से अधिक समय लगा, और इसने पूर्ण HTML, CSS और प्रतिक्रियाशील लेआउट कोड उत्पन्न किया।
इससे पता चलता है कि व्यावहारिक मूल्य वास्तव में बहुत स्पष्ट है, खासकर व्यक्तिगत ब्लॉगर्स और छोटे स्टूडियो जैसे सीमित बजट वाले समूहों के लिए, यह क्षमता सीधे वेबसाइट निर्माण लागत को हजारों से शून्य तक कम कर देती है।
आपको केवल आवश्यकताओं को प्रस्तुत करने की आवश्यकता है, और बाकी तकनीकी कार्य AI को सौंपे जाते हैं।
Case 2: KOL वाणिज्यिक सहयोग प्लेटफ़ॉर्म की जटिल प्रणाली
इस मामले की कठिनाई एक पायदान ऊपर है, मैं यह परीक्षण करना चाहता हूं कि क्या यह वास्तव में व्यावसायिक तर्क वाले प्लेटफ़ॉर्म उत्पादों को संभाल सकता है, न कि केवल एक प्रदर्शन वेबसाइट बनाना इतना आसान है।मैं एक KOL (की ओपिनियन लीडर) व्यावसायिक सहयोग प्लेटफ़ॉर्म बनाना चाहता हूँ, जिसमें प्रशंसक प्रोफ़ाइल और उद्धरण प्रदर्शित करने के लिए इन्फ्लुएंसर डेटा पैनल हो, एक बुद्धिमान मिलान प्रणाली हो जो ब्रांडों को आवश्यकताएँ दर्ज करने के बाद AI द्वारा उपयुक्त KOL की सिफारिश करे, एक समय-निर्धारण कैलेंडर हो जो अगले तीन महीनों के शेड्यूल को दृश्य रूप से प्रदर्शित करे, और इसमें अनुबंध टेम्पलेट लाइब्रेरी और डेटा ट्रैकिंग रिपोर्ट भी हो।
दृश्य शैली इंस्टाग्राम कार्ड लेआउट और B2B SaaS डैशबोर्ड शैली जैसी होनी चाहिए।
इसकी प्रसंस्करण विधि पहले मामले की तुलना में अधिक व्यवस्थित है।
सबसे पहले, कार्यात्मक मॉड्यूल को अलग किया गया, और डेटा पैनल, मिलान एल्गोरिदम, कैलेंडर घटक और दस्तावेज़ प्रबंधन जैसे उप-सिस्टम को डिज़ाइन किया गया।
फिर, फ्रंटएंड में कार्ड फ्लो लेआउट का उपयोग करके उन्हें एक साथ जोड़ा गया, और बैकएंड लॉजिक ने नकली डेटा के साथ पूरी प्रक्रिया को चलाया।
दिलचस्प बात यह है कि बुद्धिमान मिलान फ़ंक्शन करते समय, यह सक्रिय रूप से एक सरलीकृत अनुशंसा एल्गोरिदम डिज़ाइन करेगा। हालांकि यह एक वास्तविक मशीन लर्निंग मॉडल नहीं है, लेकिन टैग मिलान के तर्क के आधार पर यह पहले से ही मुख्य अवधारणा को प्रदर्शित कर सकता है।
पूरी परियोजना को विकसित करने में लगभग 20 मिनट लगे। इस स्तर की जटिलता के लिए, यदि आप एक विकास टीम ढूंढते हैं, तो इसमें लगभग एक या दो महीने लगेंगे।
और मुझे यह कहना होगा कि यह क्षमता उद्यमियों के लिए बहुत मूल्यवान है।
आपके पास एक व्यावसायिक विचार है, और आप बाजार को सत्यापित करने के लिए जल्दी से एक MVP (मिनिमम वायबल प्रोडक्ट) बनाना चाहते हैं, तो आप इस तरह से पहले उत्पाद प्रोटोटाइप बना सकते हैं, और फिर तय कर सकते हैं कि औपचारिक विकास में संसाधन निवेश करना है या नहीं।

केस 3: नई चीनी सौंदर्यशास्त्र का ऑनलाइन शिक्षा मंच
तीसरे मामले में, मैं सांस्कृतिक और रचनात्मक दिशा में इसके प्रदर्शन को आज़माना चाहता हूँ। इस प्रकार की आवश्यकताओं में न केवल कार्यात्मक कार्यान्वयन शामिल है, बल्कि सौंदर्यशास्त्र और वातावरण निर्माण भी शामिल है, जो अक्सर AI की कमजोरी होती है।
मैंने शियांगशू अकादमी नामक एक ऑनलाइन शास्त्रीय चीनी शिक्षा मंच के लिए एक वेबसाइट बनाने का अनुरोध किया, जिसमें नई चीनी सौंदर्यशास्त्र हो। रंग योजना में ऑफ-व्हाइट, स्याही रंग और सिनाबार लाल रंग का ढाल हो, पृष्ठभूमि में सुलेख या स्याही चित्रकला हो, और कणों के बिखरने का प्रभाव हो। बांस की पर्ची स्क्रॉल और मुहर जैसे प्राचीन पुस्तक तत्वों को मिलाएं, और पाठ को सोंग फ़ॉन्ट में लंबवत रूप से व्यवस्थित करें। प्रत्येक पाठ्यक्रम प्रदर्शन बॉक्स एक लाइन-बाउंड पुस्तक की तरह होना चाहिए, और पृष्ठभूमि में प्राचीन संगीत या चाय समारोह वीडियो चलना चाहिए। समग्र वातावरण सुरुचिपूर्ण और शांत होना चाहिए, जैसे कि एक अध्ययन में चाय पीते हुए और दर्शन पर चर्चा करते हुए।
निष्पादन प्रक्रिया के दौरान, इसने सांस्कृतिक प्रतीकों की समझ दिखाई।
बुनियादी दृश्य शैली को लागू करने के अलावा, यह विवरणों पर भी ध्यान देगा, जैसे कि पृष्ठ संक्रमणों में स्याही धुंधला संक्रमण एनीमेशन जोड़ना, पाठ्यक्रम कार्ड पर मुहर शैली के लेबल जोड़ना, और यहां तक कि माउस होवर करने पर ब्रश लेखन पथ एनीमेशन को ट्रिगर करना।
इन छोटी युक्तियों ने पूरे पृष्ठ को एक आत्मा दी, अब यह ठंडी कोडिंग का ढेर नहीं है।
परिणाम यह है कि मैंने इस डेमो को सांस्कृतिक संचार करने वाले एक मित्र को दिखाया, और उसकी पहली प्रतिक्रिया थी कि मैंने किस डिज़ाइन कंपनी को पाया।
जब मैंने उसे बताया कि यह AI द्वारा किया गया था, तो उसे बिल्कुल भी विश्वास नहीं हुआ।
इसलिए मैंने कहा, सौंदर्यशास्त्र के स्तर पर AI की विकास गति को कम करके आंका जा सकता है। यह न केवल मानव डिजाइन की नकल कर रहा है, बल्कि वास्तव में सांस्कृतिक अर्थ और भावनात्मक अभिव्यक्ति को समझ रहा है।

निष्कर्ष
इन कुछ मामलों का परीक्षण करने के बाद, मुझे लगता है कि MiniMax M2.5 की निष्पादन परत क्षमता वास्तव में काफी मजबूत है।
यह जटिल आवश्यकताओं को समझ सकता है, कार्यों के चरणों की स्वयं योजना बना सकता है, और गति अविश्वसनीय रूप से तेज है। आधिकारिक तौर पर कहा गया है कि अनुमान गति Opus की 3 गुना है, और मैंने परीक्षण करने के बाद महसूस किया कि यह सच है।
यदि आप भी अक्सर निष्पादन परत की तुच्छ बातों से परेशान होते हैं, तो मैं आपको व्यक्तिगत रूप से परीक्षण करने की अत्यधिक अनुशंसा करता हूं। अब API इंटरफ़ेस भी खुल गया है, और महत्वपूर्ण बात यह है कि क्या यह वास्तव में आपकी कार्यप्रवाह में एकीकृत हो सकता है।
सच कहूँ तो, AI के विकास के इस चरण में, यह अब यह सवाल नहीं है कि इसका उपयोग किया जा सकता है या नहीं, बल्कि यह सवाल है कि इसका उपयोग कैसे किया जाए।जल्दी शुरू करें, जल्दी लाभ उठाएं।





