Po testiranju MiniMax M2.5, sem začel dvomiti, ali naj podaljšam naročnino na Claude...

2/15/2026
6 min read

MiniMax M2.5 je zunaj! Takoj sem ga povezal s Claude Code in ga testiral.

Tokrat je res drugače, uradni rezultati MiniMaxa so precej eksplozivni.

SWE-Bench Verified je dobil 80,2 %, večjezično programiranje Multi-SWE-Bench je neposredno prvo, BrowseComp zmožnost iskanja pa je tudi SOTA raven 76,3 %.

Ustanovitelj OpenClaw Peter Steinberger je že v intervjujih večkrat priporočal serijo modelov MiniMax, tokrat je ob izidu M2.5 neposredno posredoval objavo:

"MiniMax je pravkar izdal MiniMaxM2.5, njegova zmogljivost je primerljiva z Opus4.6, cena pa je 20-krat nižja!"

Resnično priporočam, da ga preizkusite sami, M2.5 je popolnoma božji za razvijalce, njegova razvojna sposobnost je zelo močna!

Po uporabi M2.5 sem začel dvomiti, ali je naslednji mesec sploh še potrebno podaljšati naročnino na Claude...

Ključne prednosti

Estetika in popolnost M2.5 sta zelo visoki, še posebej je dober pri obravnavanju zelo zapletenih razvojnih zahtev. Čez nekaj časa si lahko ogledate moj drugi primer, ki je bil izveden zelo dobro, takrat je trajalo le približno 20 minut.

Uradno MiniMax M2.5 imenujejo izvorna arhitektura inteligentnega agenta, z drugimi besedami, ta model je rojen za delo.

Njegova količina aktivacijskih parametrov je le 10B, za primerjavo, vodilni modeli, kot je Claude Opus 4, imajo pogosto na stotine B parametrov. Toda M2.5 se lahko v programiranju, obdelavi dokumentov in izvajanju kompleksnih nalog kosa z vrhunskimi vodilnimi modeli.

Pravkar sem opazil, da veliko prijateljev okoli mene, ko izvaja projekte razvoja spletnih strani ali komercialnih platform, še vedno porablja denar za iskanje zunanjih izvajalcev.

Vendar moram reči, da lahko MiniMax M2.5 opravi vse te naloge, učinek pa ni nič slabši od številnih spletnih platform...

Izvedel sem 3 testne scenarije, ki pokrivajo razvoj osebne spletne strani, izgradnjo komercialne platforme in izgradnjo spletne izobraževalne platforme, poglejmo, kako se MiniMax M2.5 obnese v praksi 👇

Praktični primeri

Primer 1: Lepotna blogerka želi ustvariti spletno stran osebne blagovne znamke

Pred kratkim me je kontaktiral prijatelj, ki se ukvarja z mediji o lepoti, in rekel, da želi z AI zgraditi osebno spletno stran, da bi predstavila nekaj svojih del na družbenih medijih, kar bi bilo priročno za ogled naročnikom.

Vendar sama sploh ne razume kode, ponudbe zunanjih izvajalcev pa se začnejo pri nekaj tisoč.

Na podlagi te zahteve sem želel preizkusiti, ali lahko neposredno uporabim MiniMax M2.5 za rešitev vsega naenkrat.

Najprej je načrtoval celoten tehnični sklad in strukturo imenikov spletne strani, nato pa začel ustvarjati kodo za vsako stran posebej.

Na nekaterih mestih bo proaktivno optimiziral, na primer samodejno prilagodil število stolpcev slapu na mobilnih napravah in dodal gladko prehodno animacijo gradientnemu ozadju.

Celoten postopek je trajal le nekaj več kot tri minute in ustvaril popolno HTML, CSS in odzivno postavitev kode.

Iz tega je razvidno, da je praktična vrednost resnično očitna, še posebej za osebne blogerje in majhne studie z omejenim proračunom, ta zmožnost neposredno zniža stroške izgradnje spletne strani z več deset tisoč na nič.

Samo podajte zahteve, vse ostalo tehnično delo pa prepustite AI.

Primer 2: Kompleksen sistem platforme za komercialno sodelovanje KOL

Ta primer je stopnjo težji, želel sem preizkusiti, ali lahko obravnava platformne izdelke z resnično poslovno logiko, ne le ustvarjanje predstavitvene spletne strani.Zahtevam ustvarjanje platforme za poslovno sodelovanje s KOL (Key Opinion Leaders), ki bo imela nadzorno ploščo s podatki o vplivnežih, ki prikazuje profil oboževalcev in ponudbe, inteligentni sistem za ujemanje, ki bo blagovnim znamkam omogočil vnos zahtev in nato AI priporočil ustrezne KOL, vizualni prikaz urnika za prihodnje tri mesece, knjižnico predlog pogodb in poročila o sledenju podatkov.

Vizualni slog naj bo podoben postavitvi kartic Instagrama, združeni z nadzorno ploščo B2B SaaS.

Njegov pristop je bolj sistematičen kot pri prvem primeru.

Najprej je razčlenil funkcionalne module in zasnoval pod-sisteme za nadzorno ploščo s podatki, algoritem za ujemanje, koledarski komponento in upravljanje dokumentov.

Nato jih je povezal v tok kartic na sprednji strani, logiko ozadja pa je pognal skozi celoten proces s simuliranimi podatki.

Zanimivo je, da je pri ustvarjanju funkcije inteligentnega ujemanja proaktivno zasnoval poenostavljeno različico algoritma za priporočila. Čeprav to ni pravi model strojnega učenja, je logika, ki temelji na ujemanju oznak, že lahko prikazala osrednji koncept.

Celoten projekt je trajal približno 20 minut. Če bi to delala razvojna ekipa, bi trajalo skoraj enega ali dva meseca.

In moram reči, da je ta sposobnost izjemno dragocena za podjetnike.

Če imate poslovno idejo in želite hitro ustvariti MVP (Minimum Viable Product) za potrditev trga, lahko na ta način najprej sestavite prototip izdelka in se nato odločite, ali boste vložili vire v uradni razvoj.

Primer 3: Spletna izobraževalna platforma za novo kitajsko estetiko

V tretjem primeru sem želel preizkusiti njegovo delovanje v smeri kulturne ustvarjalnosti. Te zahteve ne vključujejo samo implementacije funkcij, temveč tudi estetiko in ustvarjanje vzdušja, kar je pogosto šibka točka AI.

Zahteval sem izdelavo spletne strani za spletno izobraževalno platformo kitajskih študij Shiguang Academy, ki naj bi imela novo kitajsko estetiko. Barve naj bodo bež, črnilo in cinabaritno rdeča v prelivih, ozadje pa naj vsebuje kaligrafska dela ali slike pokrajin s tušem, z učinkom lebdenja delcev. Vključuje elemente starodavnih knjig, kot so bambusovi zvitki in pečati, besedilo pa naj bo postavljeno navpično v pisavi Song. Vsak okvir za prikaz tečaja naj bo kot vezana knjiga, v ozadju pa naj se predvajajo videoposnetki o igranju na starodavne instrumente ali obredih pitja čaja. Splošno vzdušje naj bo uglajeno in mirno, kot da bi v študijski sobi okušali čaj in razpravljali.

Med izvajanjem je pokazal razumevanje kulturnih simbolov.

Poleg implementacije osnovnega vizualnega sloga bo delal tudi na podrobnostih, kot je dodajanje prehodne animacije z učinkom razmazanega tuša pri preklapljanju strani, dodajanje oznak v slogu pečata na kartice tečajev in celo sprožitev animacije poti pisanja s čopičem, ko se miška premakne nad element.

Te majhne misli dajejo celotni strani dušo in niso več le hladno kopičenje kode.

Rezultat je bil, da sem ta demo poslal prijatelju, ki se ukvarja s kulturno promocijo, in njegov prvi odziv je bil, da me vpraša, katero oblikovalsko podjetje sem najel.

Ko sem mu povedal, da je to naredila AI, mi sploh ni verjel.

Zato pravim, da je hitrost evolucije AI na estetski ravni morda podcenjena. Ne gre samo za posnemanje človeškega oblikovanja, ampak resnično razume kulturno vsebino in čustveno izražanje.

Povzetek

Po testiranju teh primerov menim, da je zmogljivost MiniMax M2.5 na izvedbeni ravni res dovolj dobra.

Razume lahko kompleksne zahteve, lahko sam načrtuje korake naloge in je neverjetno hiter. Uradno so rekli, da je hitrost sklepanja 3-krat hitrejša od Opusa, in po mojih testih se mi zdi, da je temu res tako.

Če vas pogosto ovirajo malenkosti na izvedbeni ravni, vam toplo priporočam, da ga sami preizkusite. API vmesnik je zdaj odprt, ključno pa je, ali se lahko resnično vključi v vaš potek dela.

Iskreno povedano, AI je v tej fazi razvoja že presegla vprašanje, ali jo je mogoče uporabljati, ampak ali jo znamo uporabljati.Začnite zgodaj, izkoristite prednosti prej.

Published in Technology

You Might Also Like