Testirao sam MiniMax M2.5 i počeo sam se pitati trebam li produžiti pretplatu na Claude...
MiniMax M2.5 je izašao! Odmah sam se povezao s Claude Codeom i testirao ga.
Ovaj put je stvarno drugačije, službeni rezultati koje je objavio MiniMax su prilično eksplozivni.
SWE-Bench Verified je dobio 80.2%, Multi-SWE-Bench višejezično programiranje je direktno prvo, BrowseComp sposobnost pretraživanja je također SOTA razina od 76.3%.
Osnivač OpenClaw-a, Peter Steinberger, više je puta preporučio MiniMax seriju modela u intervjuima, a ovaj put kada je M2.5 izašao, direktno je proslijedio objavu:
\Zahtijevam kreiranje platforme za komercijalnu saradnju sa KOL (Key Opinion Leaders), sa panelom podataka o influencerima koji prikazuje profil publike i cijene, inteligentnim sistemom uparivanja koji brendovima omogućava da unesu svoje zahtjeve nakon čega AI preporučuje odgovarajuće KOL-ove, vizualizacijom rasporeda u kalendaru za naredna tri mjeseca, kao i bibliotekom šablona ugovora i izvještajima o praćenju podataka.
Vizuelni stil treba da bude poput Instagram kartica u kombinaciji sa B2B SaaS stilom kontrolne table.
Njegov pristup je sistematičniji od prvog slučaja.
Prvo je razložio funkcionalne module, dizajnirajući zasebno panel podataka, algoritam uparivanja, komponentu kalendara i podsistem za upravljanje dokumentima.
Zatim ih je povezao u frontend-u pomoću kartičnog prikaza, a logiku backend-a je testirao simuliranim podacima kako bi provjerio cijeli proces.
Zanimljivo je da je, prilikom izrade funkcije inteligentnog uparivanja, proaktivno dizajnirao pojednostavljenu verziju algoritma preporuke. Iako to nije pravi model mašinskog učenja, logika zasnovana na uparivanju oznaka već je mogla prikazati osnovni koncept.
Cijeli projekat je razvijen za otprilike 20 minuta. Za ovaj nivo složenosti, ako biste angažovali razvojni tim, trebalo bi im najmanje mjesec ili dva.
I moram reći da je ova sposobnost od velike vrijednosti za poduzetnike.
Ako imate poslovnu ideju i želite brzo napraviti MVP (Minimum Viable Product) da biste provjerili tržište, možete koristiti ovaj pristup da prvo napravite prototip proizvoda, a zatim odlučite hoćete li uložiti resurse u formalni razvoj.

Slučaj 3: Online obrazovna platforma za kinesku estetiku novog stila
U trećem slučaju želim testirati njegove performanse u kulturnom i kreativnom smjeru. Ova vrsta zahtjeva ne uključuje samo implementaciju funkcija, već i estetiku i stvaranje atmosfere, što je često slabost AI.
Zahtijevam izradu web stranice za online platformu za obrazovanje o kineskoj kulturi pod nazivom "Shiguang Shuyuan" (Vremenska akademija), sa novom kineskom estetikom. Paleta boja treba da bude u nijansama bež, crne i grimizno crvene, sa pozadinom koja prikazuje kaligrafska djela ili pejzaže u stilu kineskog slikarstva, uz efekat raspršivanja čestica. Treba da kombinuje elemente drevnih knjiga kao što su bambusovi svici i pečati, a tekst treba da bude u vertikalnom rasporedu koristeći Song font. Svaki okvir za prikaz kursa treba da izgleda kao knjiga sa koncem, sa video snimcima sviranja drevne citre ili ceremonije čaja u pozadini. Cjelokupna atmosfera treba da bude učena i mirna, kao da se radi o degustaciji čaja i raspravi u radnoj sobi.
Tokom implementacije, pokazao je razumijevanje kulturnih simbola.
Pored implementacije osnovnog vizuelnog stila, on također obraća pažnju na detalje, kao što je dodavanje animacije prijelaza sa efektom zamućenja mastilom prilikom promjene stranice, dodavanje oznaka u stilu pečata na kartice kurseva, pa čak i pokretanje animacije putanje pisanja kistom kada se miš zadrži iznad elementa.
Ove male pažnje daju cijeloj stranici živost, umjesto da je samo hladna gomila koda.
Rezultat je da sam ovaj demo poslao prijatelju koji se bavi kulturnom promocijom, a njegova prva reakcija je bila da me pita koju sam dizajnersku kuću angažovao.
Kada sam mu rekao da je to uradio AI, nije mi vjerovao.
Zato kažem da se brzina evolucije AI u smislu estetike možda podcjenjuje. Ne samo da imitira ljudski dizajn, već zaista razumije kulturne konotacije i emocionalni izraz.

Zaključak
Nakon testiranja ovih nekoliko slučajeva, osjećam da je sposobnost MiniMax M2.5 na nivou izvršenja zaista jaka.
Može razumjeti složene zahtjeve, može sam planirati korake zadatka, a brzina je nevjerovatno velika. Zvanično se kaže da je brzina zaključivanja 3 puta veća od Opus-a, a nakon testiranja, zaista imam taj osjećaj.
Ako vas često usporavaju trivijalnosti na nivou izvršenja, toplo preporučujem da ga sami testirate. API interfejs je sada otvoren, a ključno je vidjeti može li se zaista integrirati u vaš radni proces.
Iskreno govoreći, u ovoj fazi razvoja AI, više se ne radi o tome može li se koristiti, već o tome kako se koristi.Počnite ranije, imajte koristi ranije.





