Pasi testova MiniMax M2.5, fillova të dyshoj nëse duhet të rinovoj Claude...

2/15/2026
5 min read

MiniMax M2.5 doli! Unë menjëherë e lidha me Claude Code dhe e testova.

Këtë herë është vërtet ndryshe, rezultatet e publikuara nga MiniMax zyrtarisht janë mjaft shpërthyese.

SWE-Bench Verified mori 80.2%, programimi shumëgjuhësh Multi-SWE-Bench doli direkt i pari, aftësia e kërkimit BrowseComp është gjithashtu në nivelin SOTA me 76.3%.

Themeluesi i OpenClaw, Peter Steinberger, kishte rekomanduar disa herë serinë e modeleve MiniMax në intervista më parë, dhe këtë herë kur doli M2.5, ai e ripostoi drejtpërdrejt një postim:

\Unë kërkoj të krijoj një platformë bashkëpunimi komercial KOL, me një panel të dhënash të influencuesve që shfaq profilin e fansave dhe kuotat, një sistem inteligjent përputhjeje që lejon markat të fusin kërkesat dhe AI të rekomandojë KOL-ët e duhur, një kalendar të disponueshmërisë që shfaq vizualisht orarin për tre muajt e ardhshëm, si dhe një bibliotekë modelesh kontratash dhe raporte gjurmimi të të dhënave.

Stili vizual duhet të jetë si paraqitja e kartave të Instagramit e kombinuar me stilin e panelit të kontrollit B2B SaaS.

Ajo e trajton këtë në një mënyrë më sistematike se rasti i parë.

Së pari, dekompozohen modulet funksionale dhe dizajnohen nënsistemet e panelit të të dhënave, algoritmit të përputhjes, komponentit të kalendarit dhe menaxhimit të dokumenteve.

Më pas, ato lidhen së bashku në front-end me një paraqitje të rrjedhës së kartave, dhe logjika e back-end ekzekutohet përmes të dhënave të simuluara për të përfunduar të gjithë procesin.

Interesante është se kur bën funksionin e përputhjes inteligjente, ajo do të dizajnojë në mënyrë aktive një version të thjeshtuar të algoritmit të rekomandimit. Edhe pse nuk është një model i vërtetë i mësimit të makinerisë, logjika e bazuar në përputhjen e etiketave mund të shfaqë tashmë konceptin thelbësor.

I gjithë projekti zgjati rreth 20 minuta për t'u zhvilluar. Nëse një ekip zhvillimi do ta bënte këtë nivel kompleksiteti, do të duheshin pothuajse një ose dy muaj.

Dhe duhet të them se kjo aftësi është jashtëzakonisht e vlefshme për sipërmarrësit.

Nëse keni një ide biznesi dhe dëshironi të krijoni shpejt një MVP (Minimum Viable Product - Produkt Minimalisht i Zbatueshëm) për të verifikuar tregun, mund të përdorni këtë metodë për të ndërtuar prototipin e produktit fillimisht dhe më pas të vendosni nëse dëshironi të investoni burime për zhvillimin zyrtar.

Rasti 3: Platformë edukimi online e estetikës së stilit të ri kinez

Rastin e tretë, dua të provoj performancën e tij në drejtimin e krijimtarisë kulturore. Këto lloj kërkesash nuk përfshijnë vetëm realizimin e funksioneve, por edhe estetikën dhe krijimin e atmosferës, që shpesh janë pika të dobëta të AI.

Unë kërkoj të krijoj një faqe interneti për platformën e edukimit online të studimeve kombëtare të quajtur "Akademia e Kohës", me një estetikë të re kineze. Skema e ngjyrave duhet të përdorë të bardhë krem, ngjyrë boje dhe gradient të kuq vermilion, me vepra kaligrafie ose peizazhe me bojë uji në sfond, dhe një efekt të shpërndarjes së grimcave. Elementet e librave të lashtë si rrotullat e bambusë dhe vulat duhet të integrohen, dhe teksti duhet të jetë në formatin vertikal të fontit Song. Çdo kuti shfaqjeje e kursit duhet të jetë si një libër i lidhur me fije, me video të muzikës klasike ose ceremonisë së çajit që luhen në sfond. Atmosfera e përgjithshme duhet të jetë e rafinuar dhe e qetë, si të shijosh çaj dhe të diskutosh doktrinën në një studio.

Gjatë ekzekutimit, ajo tregoi një aftësi për të kuptuar simbolet kulturore.

Përveç realizimit të stilit bazë vizual, ajo gjithashtu do të punojë në detaje, siç është shtimi i një animacioni tranzicioni të njollosjes së bojës në kalimet e faqeve, shtimi i etiketave në stilin e vulave në kartat e kursit, dhe madje shkaktimi i një animacioni të rrugës së shkrimit me furçë kur lëvizni kursorin e miut.

Këto detaje e bëjnë të gjithë faqen të gjallë dhe jo vetëm një grumbull i ftohtë kodi.

Si rezultat, e dërgova këtë demo tek një mik që punon në komunikimin kulturor, dhe reagimi i saj i parë ishte të më pyeste se cilën kompani dizajni kisha punësuar.

Kur i thashë se ishte bërë nga AI, ajo nuk më besoi fare.

Kështu që them se shpejtësia e evolucionit të AI në nivelin estetik mund të nënvlerësohet. Nuk po imiton vetëm dizajnin njerëzor, por po kupton vërtet konotacionet kulturore dhe shprehjen emocionale.

Përmbledhje

Pas testimit të këtyre rasteve, mendoj se aftësia e MiniMax M2.5 në shtresën e ekzekutimit është vërtet e fortë.

Ajo mund të kuptojë kërkesa komplekse, mund të planifikojë vetë hapat e detyrës dhe është jashtëzakonisht e shpejtë. Zyrtarët thonë se shpejtësia e arsyetimit është 3 herë më e madhe se ajo e Opus, dhe unë e kam ndjerë këtë gjatë testimit.

Nëse jeni gjithashtu shpesh të penguar nga detyrat e vogla në shtresën e ekzekutimit, ju rekomandoj shumë që ta testoni vetë. Ndërfaqja API është gjithashtu e hapur tani, dhe çelësi është të shihni nëse mund të integrohet vërtet në rrjedhën tuaj të punës.

Sinqerisht, në këtë fazë të zhvillimit të AI, nuk është më çështje nëse mund të përdoret, por nëse dini ta përdorni.Filloni herët, përfitoni herët.

Published in Technology

You Might Also Like