Vlerësimi i MiniMax M2.5 nga 稀宇 (Xiyu)
2/14/2026
2 min read
Vlerësimi i MiniMax M2.5 nga 稀宇 (Xiyu)\n\nPërfundim i shkurtër: Rrënjosje poshtë, rritje lart\n\n## Informacion bazë\n\nMiniMax M2.1 e gjeneratës së mëparshme nga 稀宇 (Xiyu), për shkak të problemeve teknike, megjithëse kishte përparim të konsiderueshëm në programim, aftësia logjike ishte prapa M2. Për fat të mirë, M2.5 në thelb zgjidhi problemet teknike dhe aftësia u kthye në rrugën e duhur. Krahasuar me M2, përparimi i M2.5 është rreth 17%.\n\nMegjithatë, një pjesë e përparimit vjen nga zinxhirë më të gjatë të të menduarit dhe eksplorimi më i thellë i hapësirës së zgjidhjeve. Konsumi mesatar i Token-ave i M2.5 renditet i 6-ti më i lartë midis të gjithë modeleve të testuara, pothuajse 2 herë më shumë se ai i kundërshtarit Sonnet. Për fat të mirë, fuqia llogaritëse e 稀宇 (Xiyu) është e garantuar dhe kostoja nuk është e lartë. Megjithëse programimi nuk mund të zëvendësojë Sonnet pa asnjë mangësi, ai është plotësisht i përdorshëm për përdorim të përditshëm. M2.5 më në fund arriti qëllimin që M2.1 donte të arrinte.\n\n## Rezultatet logjike\n\n
\n\n1 Tabela tregon vetëm një pjesë të modeleve të krahasueshme për të theksuar marrëdhënien e krahasimit dhe nuk është një renditje e plotë.\n\n2 Për pyetjet dhe metodat e testimit, shihni: Vlerësimi horizontal i aftësisë logjike të modelit të madh gjuhësor - Lista mujore 26-01. U shtua pyetja #56.\n\n*3 Lista e plotë përditësohet në https://llm2014.github.io/llm_benchmark/\n\n*4 E kuqja është e kufizuar gjatë Festivalit të Pranverës, duke treguar gëzim dhe nuk ka kuptim tjetër.\n\nPër shkak se M2.1 është një version me një defekt dhe aftësi logjike jashtëzakonisht të ulët, krahasimi ndërmjet gjeneratave M2 dhe M2.5 do të bëhet vetëm më poshtë.\n\n## Përmirësime\n\n- Arsyetim i qëndrueshëm: M2.5 mund të ruajë kufizimet fillestare dhe detajet e kontekstit gjatë një procesi më të gjatë arsyetimi, kështu që disa probleme që nuk janë shumë të vështira, por kërkojnë
Published in Technology





