Etter å ha testet MiniMax M2.5, begynner jeg å lure på om jeg skal fornye Claude...
MiniMax M2.5 er ute! Jeg koblet meg umiddelbart til Claude Code for å teste den.
Denne gangen er det virkelig annerledes, MiniMax's offisielle resultater er ganske eksplosive.
SWE-Bench Verified fikk 80.2%, Multi-SWE-Bench flerspråklig programmering er direkte nummer én, BrowseComp søkeevne er også på SOTA-nivå med 76.3%.
OpenClaw-grunnlegger Peter Steinberger har tidligere anbefalt MiniMax-serien av modeller i intervjuer flere ganger. Denne gangen, da M2.5 kom ut, videresendte han direkte et innlegg:
«MiniMax har nettopp lansert MiniMaxM2.5, ytelsen er sammenlignbar med Opus4.6, og prisen er 20 ganger billigere!»
Jeg vil virkelig anbefale alle å prøve det selv, M2.5 er fullstendig en gud for utviklere, med svært sterk utviklingsevne!
Etter å ha brukt M2.5, begynner jeg å lure på om det er nødvendig å fornye Claude neste måned...

Kjernefordeler
M2.5 har en veldig høy estetikk og fullførelsesgrad, og er spesielt flink til å håndtere svært komplekse utviklingsbehov. Alle kan se mitt andre eksempel om et øyeblikk, det er veldig bra utført, og det tok bare omtrent 20 minutter.
Offisielt kaller de MiniMax M2.5 en intelligent agent-native arkitektur. Med andre ord er denne modellen født for å jobbe.
Dens aktiveringsparameterantall er bare 10B. Som en kontrast har flaggskipmodeller som Claude Opus 4 ofte hundrevis av B-parametere. Men M2.5 kan konkurrere med de beste flaggskipene innen programmering, dokumentbehandling og utførelse av komplekse oppgaver.
Jeg har nylig observert at mange venner rundt meg bruker penger på å finne eksterne ressurser når de skal utvikle nettsider eller kommersielle plattformer.
Men jeg må si at MiniMax M2.5 kan gjøre alt dette, og effekten er ikke dårligere enn mange online plattformer...
Jeg kjørte 3 testscenarier, som dekker personlig nettsideutvikling, kommersiell plattformbygging og online utdanningsplattformbygging. La oss se hvordan MiniMax M2.5 presterer i praksis 👇
Praktiske eksempler
Case 1: Skjønnhetsblogger ønsker å lage et personlig merkevarenettsted
For en tid tilbake konsulterte en venn som jobber med skjønnhetsmedier meg. Hun sa at hun ønsket å bruke AI til å bygge et personlig nettsted for å vise frem noen av sine egne sosiale medier-arbeider, slik at det var lettere for klienter å se.
Men hun forstår ikke kode i det hele tatt, og det koster flere tusen å finne eksterne ressurser.
Basert på dette behovet, ønsket jeg å teste om jeg kunne bruke MiniMax M2.5 direkte for å gjøre det i ett trinn.
Den planla først hele nettstedets tekniske stack og katalogstruktur, og begynte deretter å generere kode for hver side.
Noen steder vil den ta initiativ til å optimalisere, for eksempel automatisk justere antall kolonner i fossefallslayouten på mobile enheter, og legge til en jevn overgangsanimasjon til gradientbakgrunnen.
Hele prosessen tok bare litt over tre minutter, og genererte komplett HTML-, CSS- og responsiv layoutkode.
Det er tydelig at den praktiske verdien er veldig åpenbar, spesielt for personlige bloggere og små studioer med begrensede budsjetter. Denne evnen reduserer kostnadene for å bygge et nettsted direkte fra titusenvis til null.
Du trenger bare å komme med kravene, og overlate alt det tekniske arbeidet til AI.
Case 2: Komplekst system for KOL kommersiell samarbeidsplattform
Vanskelighetsgraden i dette tilfellet er et hakk opp. Jeg ønsket å teste om den kunne håndtere plattformprodukter med ekte forretningslogikk, ikke bare lage et demonstrasjonsnettsted. Jeg krever en KOL (Key Opinion Leader) kommersiell samarbeidsplattform, med et dashbord som viser data om influensere, inkludert demografi og priser for følgere. Et intelligent matchingssystem skal la merkevarer legge inn sine behov, og deretter skal AI anbefale passende KOL-er. En visuell kalender skal vise tilgjengelighet for de neste tre månedene. Det skal også være et bibliotek med kontraktsmaler og rapporter for datasporing.
Den visuelle stilen skal ligne Instagram-kortlayout kombinert med et B2B SaaS-dashbord.
Behandlingsmetoden er mer systematisk enn det første tilfellet.
Først dekonstruerte jeg funksjonsmodulene og designet delsystemene datapanel, matchingsalgoritme, kalenderkomponent og dokumenthåndtering.
Deretter koblet jeg dem sammen i frontenden med en kortstrømlayout, og kjørte hele prosessen i backend-logikken med simulerte data.
Interessant nok, når den lager den intelligente matchingsfunksjonen, vil den aktivt designe en forenklet versjon av anbefalingsalgoritmen. Selv om det ikke er en ekte maskinlæringsmodell, kan logikken basert på tagmatching allerede vise kjernekonseptet.
Hele prosjektet tok omtrent 20 minutter å utvikle. Med denne kompleksiteten ville det nesten ikke vært mulig å få det gjort på under et par måneder med et utviklingsteam.
Og jeg må si at denne evnen er enormt verdifull for gründere.
Hvis du har en forretningsidé og ønsker å raskt lage en MVP (Minimum Viable Product) for å validere markedet, kan du bruke denne metoden til å sette opp en produktprototype først, og deretter bestemme om du vil investere ressurser i formell utvikling.

Case 3: Online utdanningsplattform for ny kinesisk estetikk
I det tredje tilfellet ville jeg teste ytelsen i en kulturkreativ retning. Slike krav handler ikke bare om funksjonsimplementering, men også om estetikk og atmosfære, som ofte er AI-ens svakhet.
Jeg ba om å lage et nettsted for Shiguang Academy, en online utdanningsplattform for kinesisk klassisk litteratur, med en ny kinesisk estetikk. Fargepaletten skulle være off-white, blekksvart og cinnoberrød gradient, med kalligrafiverk eller blekkmalerier i bakgrunnen, og en partikkeleffekt. Integrer elementer fra gamle bøker som bambusstrimler og segl, og bruk Song-skrift i vertikal layout for teksten. Hver kursvisningsboks skal ligne en trådbundet bok, med bakgrunnen som spiller av guqin- eller teseremonivideoer. Den generelle atmosfæren skal være raffinert og rolig, som å smake te og diskutere filosofi i et studierom.
Under utførelsen viste den en forståelse av kulturelle symboler.
I tillegg til å implementere den grunnleggende visuelle stilen, vil den også jobbe med detaljer, for eksempel å legge til en overgangsanimasjon med blekkvask for sideskift, legge til etiketter i seglstil på kurskortene, og til og med utløse en penselskriftbaneanimasjon når musen holdes over dem.
Disse små tankene gir hele siden ånd, i stedet for bare en kald samling av kode.
Resultatet var at jeg sendte denne demoen til en venn som jobber med kulturformidling, og hennes første reaksjon var å spørre hvilket designfirma jeg hadde brukt.
Da jeg fortalte henne at det var laget av AI, trodde hun det ikke i det hele tatt.
Så jeg sier at AI-ens evolusjonshastighet på det estetiske planet kan være undervurdert. Den imiterer ikke bare menneskelig design, men forstår virkelig kulturell konnotasjon og emosjonelt uttrykk.

Oppsummering
Etter å ha testet disse tilfellene, føler jeg at MiniMax M2.5 har en solid evne på utførelsesnivå.
Den kan forstå komplekse krav, planlegge oppgave trinn selv, og hastigheten er latterlig rask. Offisielt sies det at slutningshastigheten er 3 ganger så høy som Opus, og jeg føler at det stemmer etter å ha testet den.
Hvis du også ofte blir tynget av trivielle ting på utførelsesnivå, anbefaler jeg deg å teste den selv. API-grensesnittet er nå også åpent. Det viktigste er å se om det virkelig kan integreres i arbeidsflyten din.
Ærlig talt, på dette stadiet av AI-utviklingen er det ikke lenger et spørsmål om hvorvidt det kan brukes, men om hvordan det skal brukes.Kom i gang tidlig, dra nytte av det tidlig.





