MiniMax M2.5 ஐ சோதித்த பிறகு, Claude க்கு சந்தா புதுப்பிக்க வேண்டுமா என்று சந்தேகிக்க ஆரம்பித்தேன்...
MiniMax M2.5 வந்துவிட்டது! நான் உடனடியாக Claude Code உடன் இணைத்து சோதித்தேன்.
இந்த முறை உண்மையிலேயே வித்தியாசமானது, MiniMax அதிகாரப்பூர்வமாக வெளியிட்ட முடிவுகள் மிகவும் சிறப்பாக உள்ளன.
SWE-Bench Verified 80.2% பெற்றது, Multi-SWE-Bench பல மொழி நிரலாக்கத்தில் நேரடியாக முதலிடம், BrowseComp தேடல் திறன் 76.3% SOTA அளவை எட்டியுள்ளது.
OpenClaw நிறுவனர் Peter Steinberger முன்பு ஒரு நேர்காணலில் MiniMax தொடர் மாதிரிகளை பலமுறை பரிந்துரைத்துள்ளார், இந்த முறை M2.5 வெளியானதும் அவர் நேரடியாக ஒரு பதிவை ஃபார்வேர்ட் செய்தார்:
"MiniMax MiniMaxM2.5 ஐ வெளியிட்டுள்ளது, இதன் செயல்திறன் Opus4.6 க்கு சமமானது, மேலும் விலை 20 மடங்கு குறைவு!"
நீங்களே முயற்சி செய்து பார்க்க வேண்டும் என்று நான் மிகவும் பரிந்துரைக்கிறேன், M2.5 டெவலப்பர்களுக்கு ஒரு வரம், மேம்பாட்டு திறன் மிகவும் வலுவானது!
M2.5 ஐ பயன்படுத்திய பிறகு, அடுத்த மாதம் Claude க்கு சந்தா புதுப்பிக்க வேண்டுமா என்று சந்தேகிக்க ஆரம்பித்தேன்...

முக்கிய நன்மைகள்
M2.5 இன் அழகியல் மற்றும் நிறைவு மிகவும் அதிகமாக உள்ளது, குறிப்பாக மிகவும் சிக்கலான மேம்பாட்டு தேவைகளை கையாள்வதில் திறமையானது. எனது இரண்டாவது உதாரணத்தை நீங்கள் சிறிது நேரத்தில் பார்க்கலாம், அது மிகவும் சிறப்பாக செய்து முடித்துள்ளது, அப்போது அது சுமார் 20 நிமிடங்கள் மட்டுமே எடுத்தது.
அதிகாரப்பூர்வமாக MiniMax M2.5 ஐ ஒரு அறிவார்ந்த முகவர் சொந்த கட்டமைப்பு என்று அழைக்கிறார்கள், வேறு வார்த்தைகளில் கூறுவதானால், இந்த மாதிரி வேலை செய்வதற்காகவே பிறந்தது.
அதன் செயல்படுத்தும் அளவுருக்கள் 10B மட்டுமே, இதற்கு மாறாக, Claude Opus 4 போன்ற முதன்மை மாதிரிகள் நூற்றுக்கணக்கான B அளவுருக்களைக் கொண்டுள்ளன. ஆனால் M2.5 நிரலாக்கம், ஆவண செயலாக்கம் மற்றும் சிக்கலான பணிகளை செயல்படுத்துதல் போன்ற திசைகளில், சிறந்த முதன்மை மாதிரிகளுடன் போட்டியிட முடியும்.
சமீபத்தில் நான் கவனித்தேன், என் நண்பர்கள் பலர் சில வலைத்தள மேம்பாட்டு திட்டங்களைச் செய்கிறார்கள், அல்லது வணிகமயமாக்கல் தளங்களை உருவாக்கும்போது, அவர்கள் வெளிப்புற ஆதாரங்களுக்கு பணம் செலுத்த வேண்டும்.
ஆனால் நான் ஒன்று சொல்ல வேண்டும், இந்த வேலைகளை MiniMax M2.5 செய்ய முடியும், மேலும் இதன் விளைவு பல ஆன்லைன் தளங்களுக்கு எந்த வகையிலும் குறைவானது அல்ல...
நான் 3 சோதனை காட்சிகளை இயக்கினேன், அவை தனிப்பட்ட வலைத்தள மேம்பாடு, வணிக தளம் அமைத்தல், ஆன்லைன் கல்வி தளம் அமைத்தல் போன்ற திசைகளை உள்ளடக்கியது, MiniMax M2.5 இன் உண்மையான செயல்திறன் எப்படி இருக்கிறது என்று பார்ப்போம்👇
நடைமுறை வழக்குகள்
Case 1: அழகு பதிவர் ஒரு தனிப்பட்ட பிராண்ட் வலைத்தளத்தை உருவாக்க விரும்புகிறார்
சமீபத்தில், அழகு சுய ஊடகத்தில் பணிபுரியும் ஒரு நண்பர் என்னிடம் ஆலோசனை கேட்டார், அவர் தனது சொந்த சமூக ஊடக படைப்புகளைக் காண்பிக்கவும், வாடிக்கையாளர்களுக்கு வசதியாகக் காட்டவும் AI ஐப் பயன்படுத்தி ஒரு தனிப்பட்ட வலைத்தளத்தை உருவாக்க விரும்புகிறார் என்று கூறினார்.
ஆனால் அவருக்கு குறியீடு பற்றி எதுவும் தெரியாது, மேலும் வெளிப்புற ஆதாரங்களுக்கான மேற்கோள்கள் ஆயிரக்கணக்கில் தொடங்குகின்றன.
இந்த தேவையின் அடிப்படையில், MiniMax M2.5 ஐ நேரடியாக ஒரே நேரத்தில் பயன்படுத்த முடியுமா என்று சோதிக்க விரும்பினேன்.
இது முதலில் முழு வலைத்தளத்தின் தொழில்நுட்ப அடுக்கு மற்றும் அடைவு கட்டமைப்பை திட்டமிட்டது, பின்னர் ஒவ்வொரு பக்கமாக குறியீட்டை உருவாக்கத் தொடங்கியது.
சில இடங்களில் அது தானாகவே மேம்படுத்தும், எடுத்துக்காட்டாக, மொபைல் சாதனங்களில் தானாகவே நீர்வீழ்ச்சி ஓட்டத்தின் நெடுவரிசைகளின் எண்ணிக்கையை சரிசெய்தல் மற்றும் சாய்வு பின்னணிக்கு மென்மையான மாற்ற அனிமேஷனைச் சேர்த்தல்.
முழு செயல்முறைக்கும் சுமார் மூன்று நிமிடங்களுக்கு மேல் ஆனது, மேலும் முழுமையான HTML, CSS மற்றும் பதிலளிக்கக்கூடிய தளவமைப்பு குறியீட்டை உருவாக்கியது.
இதிலிருந்து, பயன்பாட்டு மதிப்பு மிகவும் தெளிவாக உள்ளது, குறிப்பாக தனிப்பட்ட பதிவர்கள் மற்றும் சிறிய ஸ்டுடியோக்கள் போன்ற வரையறுக்கப்பட்ட பட்ஜெட் உள்ள குழுக்களுக்கு, இந்த திறன் வலைத்தளத்தை உருவாக்கும் செலவை பல்லாயிரக்கணக்கான ரூபாயிலிருந்து பூஜ்ஜியமாகக் குறைக்கிறது.
நீங்கள் தேவைகளை முன்வைக்க வேண்டும், மீதமுள்ள தொழில்நுட்ப வேலைகள் அனைத்தையும் AI இடம் ஒப்படைக்கவும்.
Case 2: KOL வணிக ஒத்துழைப்பு தளத்தின் சிக்கலான அமைப்பு
இந்த வழக்கின் சிரமம் ஒரு படி மேலே செல்கிறது, நான் சோதிக்க விரும்புவது என்னவென்றால், அது உண்மையான வணிக தர்க்கத்துடன் கூடிய தளம் சார்ந்த தயாரிப்புகளை கையாள முடியுமா, ஒரு காட்சி வலைத்தளத்தை உருவாக்குவது அவ்வளவு எளிதானது அல்ல.நான் ஒரு KOL வணிக ஒத்துழைப்பு தளத்தை உருவாக்க விரும்புகிறேன், அதில் ரசிகர்களின் உருவப்படம் மற்றும் மேற்கோள்களைக் காண்பிக்கும்网红 தரவு பலகம் இருக்க வேண்டும், பிராண்ட் தேவைகளை உள்ளீடு செய்த பிறகு AI பொருத்தமான KOL களை பரிந்துரைக்கும் ஒரு அறிவார்ந்த பொருத்தம் அமைப்பு, எதிர்கால மூன்று மாத அட்டவணையை காட்சிக்கு வைக்கும் ஒரு காலக்கெடு நாட்காட்டி, மேலும் ஒரு ஒப்பந்த வார்ப்புரு நூலகம் மற்றும் தரவு கண்காணிப்பு அறிக்கை இருக்க வேண்டும்.
காட்சி பாணி Instagram அட்டை தளவமைப்பு மற்றும் B2B SaaS டாஷ்போர்டு பாணியை ஒத்திருக்க வேண்டும்.
இது முதல் நிகழ்வை விட மிகவும் முறையான அணுகுமுறையைக் கொண்டுள்ளது.
முதலில், செயல்பாட்டு தொகுதிகள் பிரிக்கப்பட்டன, மேலும் தரவு பலகம், பொருத்தம் அல்காரிதம், நாட்காட்டி கூறு மற்றும் ஆவண மேலாண்மை போன்ற துணை அமைப்புகள் வடிவமைக்கப்பட்டன.
பின்னர், முன் இறுதியில் அட்டை ஓட்டம் தளவமைப்புடன் இணைக்கப்பட்டது, மேலும் பின்தள தர்க்கம் மாதிரி தரவுடன் முழு செயல்முறையையும் இயக்கியது.
சுவாரஸ்யமாக, அறிவார்ந்த பொருத்தம் செயல்பாட்டைச் செய்யும்போது, அது ஒரு எளிய பரிந்துரை அல்காரிதத்தை முன்முயற்சியுடன் வடிவமைக்கும். இது உண்மையான இயந்திர கற்றல் மாதிரி இல்லாவிட்டாலும், டேக் பொருத்தம் தர்க்கத்தின் அடிப்படையில் முக்கிய கருத்தை ஏற்கனவே காட்ட முடியும்.
முழு திட்டத்தையும் உருவாக்க சுமார் 20 நிமிடங்கள் ஆனது. இந்த அளவிலான சிக்கலுக்கு, ஒரு மேம்பாட்டுக் குழுவைக் கண்டுபிடித்தால், ஒன்று அல்லது இரண்டு மாதங்களில் முடிக்க முடியாது.
மேலும் இந்த திறன் தொழில்முனைவோருக்கு மிகவும் மதிப்புமிக்கது என்று நான் சொல்ல வேண்டும்.
உங்களிடம் ஒரு வணிக யோசனை இருந்தால், சந்தையை சரிபார்க்க விரைவாக ஒரு MVP ஐ உருவாக்க விரும்பினால், இந்த வழியில் தயாரிப்பு முன்மாதிரியை முதலில் உருவாக்கலாம், பின்னர் அதிகாரப்பூர்வ மேம்பாட்டில் வளங்களை முதலீடு செய்ய வேண்டுமா என்று முடிவு செய்யலாம்.

வழக்கு 3: புதிய சீன அழகியலின் ஆன்லைன் கல்வி தளம்
மூன்றாவது வழக்கில், கலாச்சார மற்றும் ஆக்கப்பூர்வ திசையில் அதன் செயல்திறனை சோதிக்க விரும்புகிறேன். இந்த வகை தேவைகளுக்கு செயல்பாடு செயல்படுத்தல் மட்டுமல்ல, அழகியல் மற்றும் சூழ்நிலையை உருவாக்குவதும் அடங்கும், இது AI இன் பலவீனமாக இருக்கும்.
நான்时光书院 என்ற ஆன்லைன் தேசிய கல்வி தளத்திற்கு ஒரு வலைத்தளத்தை உருவாக்க விரும்புகிறேன், அது புதிய சீன அழகியலைக் கொண்டிருக்க வேண்டும். வண்ணங்கள் அரிசி வெள்ளை, மை மற்றும் செம்மஞ்சள் சிவப்பு சாய்வு, பின்னணியில் கையெழுத்து அல்லது நீர் மை நிலப்பரப்புகள் மற்றும் துகள் சிதறல் விளைவுகள் இருக்க வேண்டும். மூங்கில் சீட்டுகள் மற்றும் சுருள்கள் மற்றும் முத்திரைகள் போன்ற பண்டைய புத்தக கூறுகளை இணைக்கவும், மேலும் உரை சாங் எழுத்துருவில் செங்குத்தாக அச்சிடப்பட வேண்டும். ஒவ்வொரு பாடத்தின் காட்சி பெட்டியும் நூல் கட்டப்பட்ட புத்தகத்தைப் போல இருக்க வேண்டும், மேலும் பின்னணியில் பண்டைய இசை அல்லது தேநீர் கலை வீடியோக்களை இயக்க வேண்டும். ஒட்டுமொத்த சூழ்நிலையும் நேர்த்தியாகவும் அமைதியாகவும் இருக்க வேண்டும், ஒரு ஆய்வகத்தில் தேநீர் அருந்துவது மற்றும் தத்துவத்தைப் பற்றி விவாதிப்பது போன்ற உணர்வை ஏற்படுத்த வேண்டும்.
செயல்படுத்தும் செயல்பாட்டில், அது கலாச்சார சின்னங்களைப் புரிந்துகொள்ளும் திறனைக் காட்டுகிறது.
அடிப்படை காட்சி பாணியை செயல்படுத்துவதோடு மட்டுமல்லாமல், விவரங்களிலும் வேலை செய்யும், எடுத்துக்காட்டாக, பக்க மாறுதல்களுக்கு நீர் மை மங்கலான மாற்ற அனிமேஷனைச் சேர்ப்பது, பாட அட்டைக்கு முத்திரை பாணி லேபிள்களைச் சேர்ப்பது மற்றும் சுட்டி வட்டமிடும்போது தூரிகை எழுதும் பாதை அனிமேஷனைத் தூண்டுவது.
இந்த சிறிய எண்ணங்கள் முழு பக்கத்திற்கும் ஆன்மாவைக் கொடுக்கின்றன, மேலும் இது குளிர்ந்த குறியீட்டின் குவியல் அல்ல.
இதன் விளைவாக, நான் இந்த டெமோவை கலாச்சார தகவல்தொடர்பு செய்யும் நண்பருக்கு அனுப்பினேன், மேலும் அவர் முதலில் எந்த வடிவமைப்பு நிறுவனத்தை கண்டுபிடித்தீர்கள் என்று கேட்டார்.
இது AI ஆல் செய்யப்பட்டது என்று நான் அவளிடம் சொன்னபோது, அவள் அதை நம்பவில்லை.
எனவே அழகியல் மட்டத்தில் AI இன் பரிணாம வேகம் குறைத்து மதிப்பிடப்படலாம் என்று நான் கூறுகிறேன். இது மனித வடிவமைப்பை பின்பற்றுவது மட்டுமல்ல, கலாச்சார அர்த்தத்தையும் உணர்ச்சி வெளிப்பாட்டையும் உண்மையில் புரிந்துகொள்கிறது.

சுருக்கம்
இந்த சில நிகழ்வுகளை சோதித்த பிறகு, MiniMax M2.5 இன் செயல்படுத்தல் அடுக்கு திறன் மிகவும் கடினமானது என்று நான் உணர்கிறேன்.
இது சிக்கலான தேவைகளைப் புரிந்துகொள்ள முடியும், மேலும் பணி படிகளைத் திட்டமிட முடியும், மேலும் வேகம் மிகவும் விரைவானது. அதிகாரப்பூர்வமாக அனுமான வேகம் Opus ஐ விட 3 மடங்கு அதிகம் என்று கூறப்படுகிறது, மேலும் நான் சோதித்த பிறகு அது அந்த உணர்வை ஏற்படுத்தியது.
நீங்கள் அடிக்கடி செயல்படுத்தல் அடுக்கு விஷயங்களால் இழுக்கப்படுகிறீர்கள் என்றால், அதை நீங்களே சோதிக்க மிகவும் பரிந்துரைக்கிறேன். இப்போது API இடைமுகம் திறக்கப்பட்டுள்ளது, மேலும் இது உங்கள் பணிப்பாய்வில் உண்மையிலேயே ஒருங்கிணைக்க முடியுமா என்பது முக்கியம்.
உண்மையைச் சொன்னால், AI இப்போது இந்த கட்டத்தை அடைந்துள்ளது, இது பயன்படுத்த முடியுமா என்பது பற்றிய கேள்வி அல்ல, ஆனால் அதை எவ்வாறு பயன்படுத்துவது என்பது பற்றிய கேள்வி. சீக்கிரம் கற்றுக்கொள்ளுங்கள், சீக்கிரம் பயனடையுங்கள்.





