Efter att ha testat MiniMax M2.5, började jag undra om jag ens behöver förnya min Claude-prenumeration...
MiniMax M2.5 är här! Jag var snabb med att ansluta till Claude Code för att testa den.
Den här gången är det verkligen annorlunda, MiniMax officiella resultat är ganska explosiva.
SWE-Bench Verified fick 80.2%, Multi-SWE-Bench flerspråkig programmering direkt förstaplats, BrowseComp sökförmåga är också på en SOTA-nivå med 76.3%.
OpenClaws grundare Peter Steinberger har tidigare i intervjuer rekommenderat MiniMax-serien av modeller flera gånger, och nu när M2.5 släpptes vidarebefordrade han direkt ett inlägg:
\Jag vill skapa en plattform för kommersiellt samarbete med KOL (Key Opinion Leaders), med en datapanel som visar fansens profil och priser, ett intelligent matchningssystem som låter varumärken mata in sina behov och sedan rekommenderar AI lämpliga KOL:er, en kalender som visualiserar schemat för de kommande tre månaderna, samt ett mallbibliotek för kontrakt och dataspårningsrapporter.
Den visuella stilen ska vara som Instagram-kortlayout kombinerat med en B2B SaaS-instrumentpanel.
Dess hantering är mer systematisk än det första fallet.
Först delas funktionsmodulerna upp och följande delsystem designas: datapanel, matchningsalgoritm, kalenderkomponent och dokumenthantering.
Sedan kopplas de samman i frontend med en kortflödeslayout, och backend-logiken körs igenom hela processen med simulerad data.
Intressant nog designar den en förenklad version av rekommendationsalgoritmen när den gör den intelligenta matchningsfunktionen. Även om det inte är en riktig maskininlärningsmodell, kan logiken baserad på taggmatchning redan visa kärnkonceptet.
Hela projektet tog ungefär 20 minuter att utveckla. Med den här komplexitetsnivån skulle det nästan ta en eller två månader att få det gjort av ett utvecklingsteam.
Och jag måste säga att denna förmåga är enormt värdefull för entreprenörer.
Om du har en affärsidé och snabbt vill skapa en MVP (Minimum Viable Product) för att validera marknaden, kan du använda det här sättet för att bygga en produktprototyp först och sedan bestämma om du vill investera resurser i formell utveckling.

Fall 3: En onlineutbildningsplattform för ny kinesisk estetik
I det tredje fallet vill jag testa dess prestanda inom den kulturella och kreativa riktningen. Den här typen av krav handlar inte bara om funktionsimplementering, utan också om estetik och atmosfärskapande, vilket ofta är AI:s svaga punkt.
Jag vill ha en webbplats för onlineutbildningsplattformen Guoxue (traditionell kinesisk kultur) vid Time Academy, med en ny kinesisk estetik. Färgerna ska vara benvitt, bläck och cinnoberrött med gradienter, bakgrunden ska innehålla kalligrafiverk eller bläckmåleri, med en spridningseffekt av partiklar. Integrera element från bambu- och rullskrifter och sigill, och använd Song-typsnitt i vertikal layout för texten. Varje kursvisningsruta ska vara som en trådbunden bok, och bakgrunden ska spela upp videor av guqin (kinesisk cittra) eller teceremoni. Den övergripande atmosfären ska vara elegant och lugn, som att smutta på te och diskutera filosofi i en studio.
Under utförandet visade den en förståelse för kulturella symboler.
Förutom att implementera den grundläggande visuella stilen, gör den också saker i detalj, som att lägga till en övergångsanimation med bläckfärgning för sidbyten, lägga till etiketter i sigillstil på kurskorten och till och med utlösa en penselskriftsvägsanimation när musen hovrar över dem.
De här små detaljerna ger hela sidan en ande, och det är inte längre en kall samling av kod.
Resultatet är att jag skickade den här demon till en vän som arbetar med kulturkommunikation, och hennes första reaktion var att fråga vilket designföretag jag hade anlitat.
När jag berättade för henne att det var gjort av AI, trodde hon mig inte alls.
Så jag säger att AI:s evolutionära hastighet på det estetiska planet kan underskattas. Den imiterar inte bara mänsklig design, utan förstår verkligen kulturell innebörd och känslomässiga uttryck.

Sammanfattning
Efter att ha testat dessa fall känner jag att MiniMax M2.5:s förmåga på exekveringsnivå verkligen är tillräckligt stark.
Den kan förstå komplexa krav, planera uppgiftssteg själv och är löjligt snabb. Den officiella uppgiften är att inferenshastigheten är 3 gånger Opus, och jag känner verkligen så efter att ha testat den.
Om du också ofta dras ner av trivialiteter på exekveringsnivå, rekommenderar jag starkt att du testar den själv. API-gränssnittet är nu också öppet, och det viktigaste är att se om det verkligen kan integreras i ditt arbetsflöde.
Ärligt talat, AI har nått det här stadiet, det är inte längre en fråga om huruvida det kan användas, utan om huruvida det kommer att användas.Kom igång tidigt, dra nytta av det tidigt.





