MiniMax M2.5 പരീക്ഷിച്ച ശേഷം, Claude പുതുക്കണോ എന്ന് ഞാൻ സംശയിക്കാൻ തുടങ്ങി...
MiniMax M2.5 പുറത്തിറങ്ങി! ഞാൻ ഉടൻ തന്നെ Claude Code-ലേക്ക് കണക്ട് ചെയ്ത് പരീക്ഷിച്ചു.
ഇത്തവണ ഇത് ശരിക്കും വ്യത്യസ്തമാണ്, MiniMax ഔദ്യോഗികമായി പുറത്തുവിട്ട റിപ്പോർട്ടുകൾ അതിഗംഭീരമാണ്.
SWE-Bench Verified 80.2% നേടി, Multi-SWE-Bench മൾട്ടി-ലാംഗ്വേജ് പ്രോഗ്രാമിംഗിൽ ഒന്നാമതെത്തി, BrowseComp സെർച്ച് ശേഷി 76.3% SOTA നിലവാരത്തിലെത്തി.
OpenClaw സ്ഥാപകൻ Peter Steinberger മുമ്പ് അഭിമുഖങ്ങളിൽ MiniMax സീരീസ് മോഡലുകളെക്കുറിച്ച് പലതവണ ശുപാർശ ചെയ്തിട്ടുണ്ട്, ഈ M2.5 പുറത്തിറങ്ങിയപ്പോൾ അദ്ദേഹം ഒരു പോസ്റ്റ് പങ്കുവെച്ചു:
"MiniMax MiniMaxM2.5 പുറത്തിറക്കി, ഇതിന്റെ പ്രകടനം Opus4.6 ന് തുല്യമാണ്, വില 20 മടങ്ങ് കുറവാണ്!"
എല്ലാവരും ഇത് സ്വയം പരീക്ഷിക്കണമെന്ന് ഞാൻ ശക്തമായി ശുപാർശ ചെയ്യുന്നു, M2.5 ഡെവലപ്പർമാരുടെ ദൈവമാണ്, വികസന ശേഷി വളരെ ശക്തമാണ്!
M2.5 ഉപയോഗിച്ചതിന് ശേഷം, അടുത്ത മാസം Claude പുതുക്കേണ്ടതുണ്ടോ എന്ന് ഞാൻ സംശയിക്കാൻ തുടങ്ങി...

പ്രധാന പ്രത്യേകതകൾ
M2.5 ന്റെ രൂപകൽപ്പനയും പൂർണ്ണതയും വളരെ മികച്ചതാണ്, പ്രത്യേകിച്ചും വളരെ സങ്കീർണ്ണമായ ഡെവലപ്മെന്റ് ആവശ്യകതകൾ കൈകാര്യം ചെയ്യാൻ ഇത് വിദഗ്ദ്ധനാണ്. എന്റെ രണ്ടാമത്തെ ഉദാഹരണം കുറച്ച് സമയത്തിനുള്ളിൽ നിങ്ങൾക്ക് കാണാൻ കഴിയും, ഇത് വളരെ മികച്ച രീതിയിൽ പൂർത്തിയാക്കി, ഏകദേശം 20 മിനിറ്റ് മാത്രമാണ് എടുത്തത്.
MiniMax M2.5 നെ ഔദ്യോഗികമായി ഇന്റലിജന്റ് ഏജന്റ് നേറ്റീവ് ആർക്കിടെക്ചർ എന്നാണ് വിളിക്കുന്നത്, മറ്റൊരു വിധത്തിൽ പറഞ്ഞാൽ, ഈ മോഡൽ ജന്മനാ ജോലി ചെയ്യാൻ വിധിക്കപ്പെട്ടതാണ്.
ഇതിന്റെ ആക്ടിവേഷൻ പാരാമീറ്റർ അളവ് 10B മാത്രമാണ്, താരതമ്യപ്പെടുത്തുമ്പോൾ, Claude Opus 4 പോലുള്ള മുൻനിര മോഡലുകൾക്ക് നൂറുകണക്കിന് B പാരാമീറ്ററുകൾ ഉണ്ട്. എന്നാൽ M2.5 ന് പ്രോഗ്രാമിംഗ്, ഡോക്യുമെന്റ് പ്രോസസ്സിംഗ്, സങ്കീർണ്ണമായ ടാസ്ക്കുകൾ നടപ്പിലാക്കൽ തുടങ്ങിയ മേഖലകളിൽ മുൻനിര മോഡലുകളുമായി മത്സരിക്കാൻ കഴിയും.
ഞാൻ ഈയിടെയായി ശ്രദ്ധിച്ചു, എന്റെ പല സുഹൃത്തുക്കളും വെബ്സൈറ്റ് ഡെവലപ്മെന്റ് പ്രോജക്ടുകൾ ചെയ്യാനോ അല്ലെങ്കിൽ കൊമേഴ്സ്യൽ പ്ലാറ്റ്ഫോമുകൾ ഉണ്ടാക്കാനോ വേണ്ടി പുറത്തുനിന്നുള്ളവരെ പണം കൊടുത്ത് ഏൽപ്പിക്കുന്നു.
എന്നാൽ MiniMax M2.5 ന് ഈ ജോലികൾ ചെയ്യാൻ കഴിയും, കൂടാതെ പല ഓൺലൈൻ പ്ലാറ്റ്ഫോമുകളേക്കാളും മികച്ച ഫലങ്ങൾ നൽകാൻ ഇതിന് കഴിയും എന്ന് ഞാൻ പറയേണ്ടിയിരിക്കുന്നു...
വ്യക്തിഗത വെബ്സൈറ്റ് ഡെവലപ്മെന്റ്, കൊമേഴ്സ്യൽ പ്ലാറ്റ്ഫോം നിർമ്മാണം, ഓൺലൈൻ എജ്യുക്കേഷൻ പ്ലാറ്റ്ഫോം നിർമ്മാണം എന്നിങ്ങനെയുള്ള 3 ടെസ്റ്റ് സാഹചര്യങ്ങൾ ഞാൻ പരീക്ഷിച്ചു, MiniMax M2.5 ന്റെ യഥാർത്ഥ പ്രകടനം എങ്ങനെയാണെന്ന് നമുക്ക് നോക്കാം👇
റിയൽ-വേൾഡ് ഉദാഹരണങ്ങൾ
കേസ് 1: ഒരു ബ്യൂട്ടി ബ്ലോഗർക്ക് ഒരു വ്യക്തിഗത ബ്രാൻഡ് വെബ്സൈറ്റ് നിർമ്മിക്കണം
കുറച്ച് നാളുകൾക്ക് മുമ്പ്, ഒരു ബ്യൂട്ടി മീഡിയ സുഹൃത്ത് എന്നെ സമീപിച്ചു, അവൾക്ക് AI ഉപയോഗിച്ച് ഒരു വെബ്സൈറ്റ് നിർമ്മിക്കണമെന്നും അവളുടെ സോഷ്യൽ മീഡിയയിലെ വർക്കുകൾ അവിടെ പ്രദർശിപ്പിക്കണമെന്നും ആവശ്യപ്പെട്ടു, ഇത് ക്ലയിന്റുകൾക്ക് കാണാൻ എളുപ്പമാകും.
അവൾക്ക് കോഡിംഗിനെക്കുറിച്ച് ഒട്ടും അറിയില്ലായിരുന്നു, പുറത്ത് ഇതിനായി ആളുകളെ സമീപിച്ചപ്പോൾ ആയിരക്കണക്കിന് രൂപയാണ് അവർക്ക് ചിലവ് വരുന്നത്.
ഈ ആവശ്യം അനുസരിച്ച്, MiniMax M2.5 ഉപയോഗിച്ച് ഇത് ഒറ്റയടിക്ക് ചെയ്യാൻ കഴിയുമോ എന്ന് ഞാൻ പരീക്ഷിക്കാൻ ആഗ്രഹിച്ചു.
ആദ്യം ഇത് വെബ്സൈറ്റിന്റെ സാങ്കേതിക സ്റ്റാക്കും ഡയറക്ടറി ഘടനയും ആസൂത്രണം ചെയ്തു, തുടർന്ന് ഓരോ പേജുകൾക്കും കോഡ് ഉണ്ടാക്കാൻ തുടങ്ങി.
ചിലയിടങ്ങളിൽ ഇത് സ്വയമേവ ഒപ്റ്റിമൈസ് ചെയ്യാൻ തുടങ്ങി, ഉദാഹരണത്തിന് മൊബൈലിൽ വാട്ടർഫാൾ ഫ്ലോയുടെ നിരകളുടെ എണ്ണം സ്വയമേവ ക്രമീകരിച്ചു, ഗ്രേഡിയന്റ് ബാക്ക്ഗ്രൗണ്ടിന് സ്മൂത്ത് ട്രാൻസിഷൻ ആനിമേഷൻ നൽകി.
ഏകദേശം മൂന്ന് മിനിറ്റിനുള്ളിൽ പൂർണ്ണമായ HTML, CSS, റെസ്പോൺസീവ് ലേഔട്ട് കോഡ് എന്നിവ ഉണ്ടാക്കി.
ഇതിൽ നിന്ന് ഇതിന്റെ ഉപയോഗക്ഷമത വളരെ വ്യക്തമാണ്, പ്രത്യേകിച്ചും വ്യക്തിഗത ബ്ലോഗർമാർക്കും ചെറിയ സ്റ്റുഡിയോകൾക്കും ഇത് വളരെ ഉപകാരപ്രദമാണ്, കാരണം ഇത് വെബ്സൈറ്റ് ഉണ്ടാക്കാനുള്ള ചിലവ് ലക്ഷങ്ങളിൽ നിന്ന് പൂജ്യത്തിലേക്ക് എത്തിക്കുന്നു.
നിങ്ങൾ നിങ്ങളുടെ ആവശ്യം പറയുക, ബാക്കിയുള്ള സാങ്കേതിക കാര്യങ്ങൾ AI നോക്കിക്കോളും.
കേസ് 2: KOL കൊമേഴ്സ്യൽ കോ-ഓപ്പറേഷൻ പ്ലാറ്റ്ഫോമിന്റെ സങ്കീർണ്ണമായ സിസ്റ്റം
ഈ കേസിൽ ബുദ്ധിമുട്ട് ഒരല്പം കൂടുതലാണ്, ഒരു സാധാരണ വെബ്സൈറ്റ് ഉണ്ടാക്കുന്നതിലുപരി, ബിസിനസ്സ് ലോജിക് അടങ്ങിയ ഒരു പ്ലാറ്റ്ഫോം ഉണ്ടാക്കാൻ ഇതിന് കഴിയുമോ എന്ന് പരീക്ഷിക്കുകയാണ് ഞാൻ ലക്ഷ്യമിടുന്നത്.KOL വാണിജ്യ സഹകരണ പ്ലാറ്റ്ഫോം ഉണ്ടാക്കാൻ ഞാൻ ആവശ്യപ്പെടുന്നു. അതിൽ ആരാധകരുടെ ചിത്രം, വില എന്നിവ കാണിക്കുന്ന ഇൻഫ്ലുവൻസർ ഡാറ്റാ പാനൽ ഉണ്ടായിരിക്കണം. ബ്രാൻഡുകൾക്ക് അവരുടെ ആവശ്യകതകൾ നൽകിയ ശേഷം AI അനുയോജ്യമായ KOL-കളെ ശുപാർശ ചെയ്യുന്ന ഒരു സ്മാർട്ട് മാച്ചിംഗ് സിസ്റ്റം, അടുത്ത മൂന്ന് മാസത്തേക്കുള്ള ഷെഡ്യൂളുകൾ കാണിക്കുന്ന ഒരു വിഷ്വൽ കലണ്ടർ, കരാർ ടെംപ്ലേറ്റ് ലൈബ്രറി, ഡാറ്റാ ട്രാക്കിംഗ് റിപ്പോർട്ടുകൾ എന്നിവയും ഉണ്ടായിരിക്കണം.
കാഴ്ചയിൽ ഇത് Instagram കാർഡ് ലേഔട്ടും B2B SaaS ഡാഷ്ബോർഡിന്റെ ശൈലിയും ചേർന്നതായിരിക്കണം.
ഇത് ആദ്യത്തെ കേസിനേക്കാൾ കൂടുതൽ ചിട്ടയായ രീതിയിലാണ് കാര്യങ്ങൾ ചെയ്യുന്നത്.
ആദ്യം ഫങ്ഷണൽ മൊഡ്യൂളുകൾ വേർതിരിച്ച് ഡാറ്റാ പാനൽ, മാച്ചിംഗ് അൽഗോരിതം, കലണ്ടർ കോമ്പോണന്റ്, ഡോക്യുമെന്റ് മാനേജ്മെന്റ് എന്നിങ്ങനെ വിവിധ സബ്സിസ്റ്റങ്ങൾ രൂപകൽപ്പന ചെയ്തു.
തുടർന്ന് ഫ്രണ്ട്എൻഡിൽ കാർഡ് ഫ്ലോ ലേഔട്ട് ഉപയോഗിച്ച് ഇവയെല്ലാം കൂട്ടിച്ചേർത്തു. ബാക്ക്എൻഡ് ലോജിക് സിമുലേറ്റഡ് ഡാറ്റ ഉപയോഗിച്ച് പ്രവർത്തിപ്പിച്ചു.
ഇതിൽ രസകരമായ കാര്യം, സ്മാർട്ട് മാച്ചിംഗ് ഫംഗ്ഷൻ ചെയ്യുമ്പോൾ, ലളിതമായ ഒരു ശുപാർശ അൽഗോരിതം രൂപകൽപ്പന ചെയ്യുന്നു എന്നതാണ്. ഇത് ഒരു യഥാർത്ഥ മെഷീൻ ലേണിംഗ് മോഡൽ അല്ലെങ്കിലും, ടാഗ് മാച്ചിംഗിനെ അടിസ്ഥാനമാക്കിയുള്ള ലോജിക് പ്രധാന ആശയം അവതരിപ്പിക്കുന്നു.
ഈ പ്രോജക്റ്റ് പൂർത്തിയാക്കാൻ ഏകദേശം 20 മിനിറ്റിലധികം എടുത്തു. ഇത്രയും സങ്കീർണ്ണമായ ഒരു പ്രോജക്റ്റ് ഒരു ഡെവലപ്മെന്റ് ടീമിനെ ഏൽപ്പിച്ചാൽ ഒന്ന് രണ്ട് മാസത്തിൽ കുറഞ്ഞ സമയം എടുക്കും.
ഈ കഴിവ് സംരംഭകർക്ക് വളരെ മൂല്യവത്താണെന്ന് ഞാൻ പറയേണ്ടിയിരിക്കുന്നു.
നിങ്ങൾക്ക് ഒരു ബിസിനസ് ആശയം ഉണ്ടെങ്കിൽ, വിപണിയിൽ അതിൻ്റെ സാധ്യത അറിയാനായി ഒരു MVP (Minimum Viable Product) വേഗത്തിൽ നിർമ്മിക്കാൻ കഴിയും. അതിനുശേഷം കൂടുതൽ പണം മുടക്കി ഔദ്യോഗികമായി ഡെവലപ്പ് ചെയ്യാൻ തീരുമാനിക്കാം.

കേസ് 3: പുതിയ ചൈനീസ് സൗന്ദര്യശാസ്ത്രത്തിലുള്ള ഓൺലൈൻ വിദ്യാഭ്യാസ പ്ലാറ്റ്ഫോം
മൂന്നാമത്തെ കേസിൽ, ഒരു കൾച്ചറൽ ക്രിയേറ്റീവ് ഡയറക്ഷനിൽ ഇതിൻ്റെ പ്രകടനം എങ്ങനെയാണെന്ന് പരീക്ഷിക്കാൻ ഞാൻ ആഗ്രഹിക്കുന്നു. ഈ ആവശ്യകതകൾ ഫംഗ്ഷനുകൾ നടപ്പിലാക്കുന്നതിലുപരി സൗന്ദര്യവും അന്തരീക്ഷവും സൃഷ്ടിക്കുന്നതുമായി ബന്ധപ്പെട്ടതാണ്. ഇത് പലപ്പോഴും AI-യുടെ ഒരു പോരായ്മയാണ്.
Shiguang Academy എന്ന ഓൺലൈൻ നാഷണൽ സ്റ്റഡീസ് എജ്യുക്കേഷൻ പ്ലാറ്റ്ഫോമിനായി ഒരു വെബ്സൈറ്റ് ഉണ്ടാക്കാൻ ഞാൻ ആവശ്യപ്പെടുന്നു. അതിൽ പുതിയ ചൈനീസ് സൗന്ദര്യശാസ്ത്രം ഉണ്ടായിരിക്കണം. നിറങ്ങൾ മങ്ങിയ വെള്ള, കറുപ്പ്, സിന്നബാർ റെഡ് ഗ്രേഡിയന്റുകൾ ഉപയോഗിക്കുക. പശ്ചാത്തലത്തിൽ കാലിഗ്രാഫി വർക്കുകളോ ലാൻഡ്സ്കേപ്പ് പെയിന്റിംഗുകളോ ചേർക്കുക, പാർട്ടിക്കിൾ സ്കാറ്ററിംഗ് ഇഫക്റ്റുകളും നൽകുക. മുളങ്കാടുകളുടെ ചുരുളുകൾ, സീലുകൾ തുടങ്ങിയ പുരാതന പുസ്തകങ്ങളുടെ ഘടകങ്ങൾ സംയോജിപ്പിക്കുക. വാചകം സോങ് ടൈപ്പ്ഫേസിൽ ലംബമായി ക്രമീകരിക്കുക. ഓരോ കോഴ്സ് ഡിസ്പ്ലേ ബോക്സും ത്രെഡ് കൊണ്ട് കെട്ടിയ പുസ്തകം പോലെയായിരിക്കണം. പശ്ചാത്തലത്തിൽ പുരാതന സംഗീതമോ ചായ ഉണ്ടാക്കുന്ന വീഡിയോകളോ പ്ലേ ചെയ്യുക. മൊത്തത്തിലുള്ള അന്തരീക്ഷം ശാന്തവും സമാധാനപരവുമായിരിക്കണം, ഒരു പഠനമുറിയിൽ ചായ കുടിക്കുന്നതും ചർച്ച ചെയ്യുന്നതും പോലുള്ള അനുഭവം നൽകണം.
ഇത് ചെയ്യുന്നതിനിടയിൽ, സാംസ്കാരിക ചിഹ്നങ്ങളെക്കുറിച്ചുള്ള AI-യുടെ ഗ്രാഹ്യം പ്രകടമായിരുന്നു.
അടിസ്ഥാനപരമായ വിഷ്വൽ ശൈലി നടപ്പിലാക്കുന്നതിനു പുറമേ, വിശദാംശങ്ങളിലും ശ്രദ്ധ ചെലുത്തുന്നു. ഉദാഹരണത്തിന്, പേജുകൾ മാറുമ്പോൾ മഷി പടരുന്ന ഒരു ആനിമേഷൻ നൽകുന്നു, കോഴ്സ് കാർഡുകളിൽ സീലിന്റെ രൂപത്തിലുള്ള ലേബലുകൾ ചേർക്കുന്നു, മൗസ് ഹോവർ ചെയ്യുമ്പോൾ കാലിഗ്രാഫി എഴുതുന്ന പാതയുടെ ആനിമേഷൻ വരെ നൽകുന്നു.
ഈ ചെറിയ കാര്യങ്ങൾ പേജിന് ഒരു പ്രത്യേക ഭംഗി നൽകുന്നു, ഇത് വെറും കോഡിന്റെ കൂടിച്ചേരലായി തോന്നുന്നില്ല.
ഈ ഡെമോ കൾച്ചറൽ കമ്മ്യൂണിക്കേഷൻ ചെയ്യുന്ന ഒരു സുഹൃത്തിന് ഞാൻ അയച്ചുകൊടുത്തു. ആദ്യ പ്രതികരണം ഏത് ഡിസൈൻ കമ്പനിയെയാണ് ഇതിനായി സമീപിച്ചതെന്നായിരുന്നു.
ഇത് AI ചെയ്തതാണെന്ന് പറഞ്ഞപ്പോൾ അവൾ വിശ്വസിച്ചില്ല.
സൗന്ദര്യശാസ്ത്രപരമായ കാര്യങ്ങളിൽ AI-യുടെ വളർച്ച കുറച്ചുകാണാൻ സാധ്യതയുണ്ടെന്ന് ഞാൻ പറയുന്നത് അതുകൊണ്ടാണ്. ഇത് മനുഷ്യരുടെ ഡിസൈനുകളെ അനുകരിക്കുക മാത്രമല്ല, സാംസ്കാരികമായ കാര്യങ്ങളും ഇമോഷനൽ എക്സ്പ്രഷനുകളും ശരിക്കും മനസ്സിലാക്കുന്നുണ്ട്.

സംഗ്രഹം
ഈ കേസുകളെല്ലാം പരിശോധിച്ച ശേഷം, MiniMax M2.5-ന് കാര്യങ്ങൾ ചെയ്യാനുള്ള കഴിവുണ്ട് എന്ന് മനസ്സിലായി.
സങ്കീർണ്ണമായ ആവശ്യകതകൾ മനസ്സിലാക്കാനും ടാസ്ക്കുകൾ എങ്ങനെ ചെയ്യണമെന്ന് സ്വയം തീരുമാനിക്കാനും ഇതിന് കഴിയും. മാത്രമല്ല, ഇത് വളരെ വേഗത്തിൽ കാര്യങ്ങൾ ചെയ്യുന്നു. ഇതിന്റെ വേഗത Opus-നേക്കാൾ 3 മടങ്ങ് കൂടുതലാണെന്ന് ഒദ്യോഗികമായി പറയുന്നു. ഞാൻ പരിശോധിച്ചപ്പോൾ അത് ശരിയാണെന്ന് തോന്നി.
നിങ്ങൾ ചെയ്യുന്ന കാര്യങ്ങളിൽ മടുപ്പ് തോന്നുന്നുണ്ടെങ്കിൽ, ഇത് സ്വയം പരീക്ഷിക്കാൻ ഞാൻ ശുപാർശ ചെയ്യുന്നു. ഇതിന്റെ API ഇന്റർഫേസ് ഇപ്പോൾ ലഭ്യമാണ്. ഇത് നിങ്ങളുടെ ജോലിയിൽ എത്രത്തോളം ഉപയോഗപ്രദമാകുമെന്ന് കണ്ടറിയണം.
AI ഇപ്പോൾ എവിടെ എത്തിനിൽക്കുന്നു എന്ന് വെച്ചാൽ ഇത് ഉപയോഗിക്കാൻ പറ്റുമോ എന്നുള്ള ചോദ്യം മാറി എങ്ങനെ ഉപയോഗിക്കാം എന്നുള്ളതിലേക്ക് എത്തിയിരിക്കുന്നു.നേരത്തെ പഠിക്കൂ, നേരത്തെ പ്രയോജനം നേടൂ.





