Baada ya Kujaribu MiniMax M2.5, Nilianza Kuwa na Shaka Kama Bado Nahitaji Kuendelea Kulipia Claude...
MiniMax M2.5 imetoka! Mara moja niliiunganisha na Claude Code kwa ajili ya majaribio.
Safari hii ni tofauti kweli, matokeo yaliyotangazwa rasmi na MiniMax ni ya kushangaza sana.
SWE-Bench Verified ilipata 80.2%, Multi-SWE-Bench programu ya lugha nyingi ilikuwa ya kwanza moja kwa moja, uwezo wa utafutaji wa BrowseComp pia ni kiwango cha SOTA cha 76.3%.
Mwanzilishi wa OpenClaw, Peter Steinberger, hapo awali alikuwa amependekeza mara kadhaa mfululizo wa modeli za MiniMax katika mahojiano, na safari hii M2.5 ilipotoka, alishiriki chapisho moja kwa moja:
"MiniMax imetoa MiniMaxM2.5 hivi punde, utendaji wake ni sawa na Opus4.6, na bei ni nafuu mara 20!"
Ninapendekeza sana kila mtu ajaribu mwenyewe, M2.5 ni mungu wa wasanidi programu, na uwezo wake wa ukuzaji ni nguvu sana!
Baada ya kutumia M2.5, nimeanza kuwa na shaka kama ni muhimu kuendelea kulipia Claude mwezi ujao...

Faida Muhimu
Urembo na ukamilifu wa M2.5 ni wa hali ya juu sana, haswa katika kushughulikia mahitaji magumu sana ya ukuzaji. Kila mtu anaweza kuangalia mfano wangu wa 2 baadaye, umekamilika vizuri sana, ilichukua kama dakika 20 tu wakati huo.
Maafisa huita MiniMax M2.5 usanifu asilia wa wakala mahiri, kwa maneno mengine, modeli hii imezaliwa kufanya kazi.
Ina idadi ya vigezo vya uanzishaji vya 10B pekee. Kwa kulinganisha, modeli za bendera kama vile Claude Opus 4 zina mamia ya vigezo vya B. Lakini M2.5 inaweza kushindana na bendera za juu katika programu, usindikaji wa hati, na utekelezaji wa kazi ngumu.
Hivi majuzi nimeona kwamba marafiki wengi karibu nami huenda kufanya miradi ya ukuzaji wa tovuti, au majukwaa ya kibiashara, na bado wanapaswa kulipa pesa kupata wataalamu wa nje.
Lakini lazima niseme, MiniMax M2.5 inaweza kufanya kazi hizi, na athari sio duni kuliko majukwaa mengi ya mtandaoni...
Nilifanya majaribio 3, yakishughulikia ukuzaji wa tovuti ya kibinafsi, ujenzi wa jukwaa la kibiashara, na ujenzi wa jukwaa la elimu ya mtandaoni. Hebu tuangalie jinsi MiniMax M2.5 inavyofanya kazi katika vita halisi👇
Mifano Halisi
Kesi ya 1: Mwanablogu wa urembo anataka kutengeneza tovuti ya chapa ya kibinafsi
Muda si mrefu uliopita, rafiki ambaye anafanya kazi katika vyombo vya habari vya urembo aliniuliza, akisema kwamba anataka kutumia AI kujenga tovuti ya kibinafsi ili kuonyesha baadhi ya kazi zake za mitandao ya kijamii, ili iwe rahisi kwa Chama A kuona.
Lakini hajui kabisa kuhusu msimbo, na bei za wataalamu wa nje ni maelfu ya dola.
Kulingana na mahitaji haya, nilitaka kujaribu kama ninaweza kutumia MiniMax M2.5 moja kwa moja katika hatua moja.
Kwanza ilipanga mrundikano mzima wa teknolojia ya tovuti na muundo wa saraka, na kisha ikaanza kutoa msimbo wa kila ukurasa mmoja baada ya mwingine.
Katika maeneo mengine, itachukua hatua ya kuboresha, kama vile kurekebisha kiotomatiki idadi ya safu wima za maporomoko ya maji kwenye simu, na kuongeza uhuishaji laini wa mpito kwenye asili ya gradient.
Mchakato mzima ulichukua kama dakika tatu tu, na kutoa HTML kamili, CSS na msimbo wa mpangilio msikivu.
Inaweza kuonekana kuwa thamani ya vitendo ni dhahiri sana, haswa kwa wanablogu binafsi na studio ndogo zilizo na bajeti ndogo. Uwezo huu hupunguza moja kwa moja gharama ya ujenzi wa tovuti kutoka makumi ya maelfu ya dola hadi sifuri.
Unahitaji tu kuwasilisha mahitaji, na kazi zote za kiufundi zitaachwa kwa AI.
Kesi ya 2: Mfumo mgumu wa jukwaa la ushirikiano wa kibiashara la KOL
Ugumu wa kesi hii umeongezeka kwa kiwango, ninataka kujaribu ikiwa inaweza kushughulikia bidhaa za aina ya jukwaa na mantiki halisi ya biashara, sio tu kutengeneza tovuti ya maonyesho.Niliomba kuundwa kwa jukwaa la ushirikiano wa kibiashara la KOL, liwe na paneli ya data ya watu mashuhuri mtandaoni (influencer) inayoonyesha wasifu wa mashabiki na bei, mfumo mahiri wa kulinganisha ambao unaruhusu chapa kuingiza mahitaji na AI inapendekeza KOLs wanaofaa, kalenda ya ratiba inayoonyesha ratiba ya miezi mitatu ijayo, na pia kuwa na maktaba ya violezo vya mkataba na ripoti za ufuatiliaji wa data.
Mtindo wa kuona unapaswa kuwa kama mpangilio wa kadi za Instagram pamoja na mtindo wa dashibodi ya B2B SaaS.
Njia yake ya kushughulikia ni ya kimfumo zaidi kuliko kesi ya kwanza.
Kwanza, ilivunja moduli za kazi, na kubuni mifumo ndogo kadhaa: paneli ya data, algorithm ya kulinganisha, sehemu ya kalenda, na usimamizi wa hati.
Kisha, iliziunganisha pamoja kwa kutumia mpangilio wa mtiririko wa kadi kwenye upande wa mbele, na mantiki ya upande wa nyuma ilitumia data iliyoigwa kuendesha mchakato mzima.
Kinachovutia ni kwamba, wakati ilipokuwa ikifanya kazi ya kulinganisha akili bandia (AI), ilibuni kwa hiari algorithm iliyorahisishwa ya mapendekezo. Ingawa haikuwa mfumo halisi wa kujifunza kwa mashine (machine learning), mantiki ya kulinganisha lebo tayari iliweza kuonyesha dhana kuu.
Mradi mzima ulichukua kama dakika 20 kukamilika. Ugumu wa kiwango hiki, ikiwa unatafuta timu ya wasanidi programu, karibu haiwezekani kukamilika chini ya mwezi mmoja au miwili.
Na lazima niseme, uwezo huu ni wa thamani kubwa kwa wajasiriamali.
Ikiwa una wazo la kibiashara na unataka haraka kuunda MVP (Minimum Viable Product) ili kuthibitisha soko, unaweza kutumia njia hii kuunda mfano wa bidhaa kwanza, na kisha kuamua ikiwa utawekeza rasilimali katika maendeleo rasmi.

Kesi ya 3: Jukwaa la Elimu ya Mtandaoni la Urembo wa Kichina Mpya
Katika kesi ya tatu, nilitaka kujaribu utendaji wake katika mwelekeo wa ubunifu wa kitamaduni. Mahitaji haya sio tu utekelezaji wa kazi, lakini pia yanahusisha urembo na uundaji wa mazingira, ambayo mara nyingi ni udhaifu wa AI.
Niliomba kuunda tovuti ya Chuo cha Shiguang, jukwaa la elimu ya mtandaoni ya masomo ya kitamaduni ya Kichina, na urembo mpya wa Kichina. Mpango wa rangi unapaswa kuwa mchanganyiko wa rangi ya cream, wino na vermilion, na asili inapaswa kuwa na kazi za calligraphy au mandhari ya wino, pamoja na athari ya chembe zinazotawanyika. Unganisha vipengele vya vitabu vya kale kama vile hati za mianzi na mihuri, na maandishi yanapaswa kuwa katika mpangilio wima wa mtindo wa Wimbo. Kila sanduku la maonyesho ya kozi linapaswa kuwa kama kitabu kilichofungwa kwa uzi, na asili inapaswa kucheza video za kinubi cha kale au sherehe ya chai. Mazingira ya jumla yanapaswa kuwa ya kifahari na ya utulivu, kama vile kuonja chai na kujadili falsafa katika chumba cha kusoma.
Katika mchakato wa utekelezaji, ilionyesha uelewa wa alama za kitamaduni.
Mbali na kutekeleza mtindo wa msingi wa kuona, pia ingefanya kazi kwenye maelezo, kama vile kuongeza uhuishaji wa mpito wa madoa ya wino kwenye mabadiliko ya ukurasa, kuongeza lebo za mtindo wa muhuri kwenye kadi za kozi, na hata kusababisha uhuishaji wa njia ya uandishi wa brashi wakati panya inapoegemea.
Mawazo haya madogo yalifanya ukurasa mzima kuwa na uhai, badala ya mkusanyiko wa nambari baridi.
Matokeo yake, nilituma onyesho hili kwa marafiki ambao wanafanya kazi katika mawasiliano ya kitamaduni, na majibu yao ya kwanza yalikuwa kuniuliza niliajiri kampuni gani ya kubuni.
Nilipowaambia kuwa ilifanywa na AI, hawakuamini kabisa.
Kwa hivyo nasema, kasi ya mageuzi ya AI katika kiwango cha urembo inaweza kuwa imedharauliwa. Haiishii tu kuiga miundo ya wanadamu, lakini inaelewa kweli maana ya kitamaduni na usemi wa hisia.

Muhtasari
Baada ya kujaribu kesi hizi kadhaa, ninahisi kuwa uwezo wa MiniMax M2.5 katika kiwango cha utekelezaji ni mgumu kweli.
Inaweza kuelewa mahitaji changamano, inaweza kupanga hatua za kazi yenyewe, na ni haraka sana. Rasmi wanasema kwamba kasi ya uamuzi ni mara 3 ya Opus, na nimegundua kuwa ni kweli.
Ikiwa wewe pia mara nyingi unacheleweshwa na mambo madogo madogo katika kiwango cha utekelezaji, ninapendekeza sana ujaribu mwenyewe. API (Application Programming Interface) tayari imefunguliwa, na jambo muhimu ni kuona ikiwa inaweza kuunganishwa kweli katika mtiririko wako wa kazi.
Kusema kweli, AI imefikia hatua hii ya maendeleo, sio tena swali la ikiwa inaweza kutumika, lakini swali la ikiwa unajua jinsi ya kuitumia.Anza mapema, faida mapema.





