Testirao sam MiniMax M2.5 i počeo se pitati trebam li uopće produžiti pretplatu na Claude...
MiniMax M2.5 je izašao! Odmah sam se spojio na Claude Code i testirao ga.
Ovaj put je stvarno drugačije, službeni rezultati koje je objavio MiniMax su prilično eksplozivni.
SWE-Bench Verified je dobio 80.2%, Multi-SWE-Bench višejezično programiranje je izravno prvo, a BrowseComp sposobnost pretraživanja je također SOTA razine s 76.3%.
Osnovatelj OpenClaw-a, Peter Steinberger, već je u intervjuima više puta preporučio MiniMax seriju modela, a ovaj put kada je izašao M2.5, izravno je proslijedio objavu:
\Tražim da se kreira platforma za poslovnu suradnju s KOL-ovima (Key Opinion Leaders), s panelom podataka o influencerima koji prikazuje demografiju pratitelja i cijene, inteligentnim sustavom za uparivanje koji omogućuje brendovima da unesu svoje zahtjeve, a AI preporuči odgovarajuće KOL-ove, vizualnim prikazom rasporeda u kalendaru za sljedeća tri mjeseca, te bibliotekom predložaka ugovora i izvješćima o praćenju podataka.
Vizualni stil treba biti poput Instagram kartica u kombinaciji s B2B SaaS nadzornom pločom.
Njegov pristup je sustavniji od prvog slučaja.
Prvo se rastavljaju funkcionalni moduli i dizajniraju se podsustavi za panel podataka, algoritam za uparivanje, komponenta kalendara i upravljanje dokumentima.
Zatim se na frontendu povezuju pomoću kartičnog prikaza, a backend logika se provjerava simuliranim podacima.
Zanimljivo je da prilikom izrade funkcije inteligentnog uparivanja aktivno dizajnira pojednostavljenu verziju algoritma preporuke. Iako to nije pravi model strojnog učenja, logika temeljena na podudaranju oznaka već može prikazati ključne koncepte.
Cijeli projekt je razvijen za otprilike 20 minuta. Za ovu razinu složenosti, ako biste angažirali razvojni tim, trebalo bi im barem mjesec ili dva.
I moram reći da je ova sposobnost iznimno vrijedna za poduzetnike.
Ako imate poslovnu ideju i želite brzo napraviti MVP (Minimum Viable Product) za validaciju tržišta, možete koristiti ovu metodu za izradu prototipa proizvoda, a zatim odlučiti hoćete li uložiti resurse u formalni razvoj.

Slučaj 3: Online obrazovna platforma za kinesku estetiku novog stila
U trećem slučaju želim testirati njegovu izvedbu u području kulturne kreativnosti. Ova vrsta zahtjeva ne uključuje samo implementaciju funkcija, već i estetiku i stvaranje atmosfere, što je često slabost AI-a.
Tražim da se izradi web stranica za online platformu za obrazovanje o kineskoj kulturi pod nazivom "Shiguang Shuyuan", s novom kineskom estetikom. Paleta boja treba biti u nijansama bež, crne i crvene boje cinabarita, s pozadinom koja prikazuje kaligrafska djela ili slike pejzaža u stilu tuša, s efektom raspršenih čestica. Treba kombinirati elemente drevnih knjiga kao što su bambusovi svici i pečati, a tekst treba biti u uspravnom formatu koristeći Song font. Svaki okvir za prikaz tečaja treba izgledati kao knjiga s koncem, s videozapisima o sviranju drevne citre ili ceremoniji čaja u pozadini. Cjelokupna atmosfera treba biti profinjena i mirna, poput osjećaja ispijanja čaja i raspravljanja o filozofiji u radnoj sobi.
Tijekom izvršenja, pokazao je razumijevanje kulturnih simbola.
Osim implementacije osnovnog vizualnog stila, također se fokusira na detalje, kao što je dodavanje prijelazne animacije s efektom zamućenja tinte pri prebacivanju stranica, dodavanje oznaka u stilu pečata na kartice tečaja, pa čak i pokretanje animacije pisanja kistom prilikom prelaska mišem.
Ovi mali detalji daju dušu cijeloj stranici, umjesto da je to samo hladna hrpa koda.
Rezultat je bio da sam poslao ovaj demo prijatelju koji se bavi kulturnom promocijom, a njegova prva reakcija je bila da me pita koju sam dizajnersku tvrtku angažirao.
Kad sam mu rekao da je to napravio AI, nije mi vjerovao.
Zato kažem da se brzina evolucije AI-a u smislu estetike možda podcjenjuje. Ne samo da oponaša ljudski dizajn, već doista razumije kulturne konotacije i emocionalni izraz.

Zaključak
Nakon testiranja ovih nekoliko slučajeva, osjećam da je sposobnost MiniMax M2.5 na razini izvršenja zaista jaka.
Može razumjeti složene zahtjeve, može sam planirati korake zadatka, a brzina je nevjerojatno velika. Službeno se navodi da je brzina zaključivanja 3 puta veća od Opusa, a prema mojim testiranjima, to je istina.
Ako vas često usporavaju trivijalnosti na razini izvršenja, toplo preporučujem da ga sami testirate. API sučelje je sada otvoreno, a ključno je vidjeti može li se uistinu integrirati u vaš radni tijek.
Iskreno govoreći, u ovoj fazi razvoja AI-a, pitanje više nije može li se koristiti, već kako ga koristiti.Počnite ranije, imajte koristi ranije.





