Vlerësimi i MiniMax M2.5 nga 稀宇 (Xiyu)

2/14/2026

2 min read

Vlerësimi i MiniMax M2.5 nga 稀宇 (Xiyu)\n\nPërfundim i shkurtër: Rrënjosje poshtë, rritje lart\n\n## Informacion bazë\n\nMiniMax M2.1 e gjeneratës së mëparshme nga 稀宇 (Xiyu), për shkak të problemeve teknike, megjithëse kishte përparim të konsiderueshëm në programim, aftësia logjike ishte prapa M2. Për fat të mirë, M2.5 në thelb zgjidhi problemet teknike dhe aftësia u kthye në rrugën e duhur. Krahasuar me M2, përparimi i M2.5 është rreth 17%.\n\nMegjithatë, një pjesë e përparimit vjen nga zinxhirë më të gjatë të të menduarit dhe eksplorimi më i thellë i hapësirës së zgjidhjeve. Konsumi mesatar i Token-ave i M2.5 renditet i 6-ti më i lartë midis të gjithë modeleve të testuara, pothuajse 2 herë më shumë se ai i kundërshtarit Sonnet. Për fat të mirë, fuqia llogaritëse e 稀宇 (Xiyu) është e garantuar dhe kostoja nuk është e lartë. Megjithëse programimi nuk mund të zëvendësojë Sonnet pa asnjë mangësi, ai është plotësisht i përdorshëm për përdorim të përditshëm. M2.5 më në fund arriti qëllimin që M2.1 donte të arrinte.\n\n## Rezultatet logjike\n\n\n\n1 Tabela tregon vetëm një pjesë të modeleve të krahasueshme për të theksuar marrëdhënien e krahasimit dhe nuk është një renditje e plotë.\n\n2 Për pyetjet dhe metodat e testimit, shihni: Vlerësimi horizontal i aftësisë logjike të modelit të madh gjuhësor - Lista mujore 26-01. U shtua pyetja #56.\n\n3 Lista e plotë përditësohet në https://llm2014.github.io/llm_benchmark/\n\n4 E kuqja është e kufizuar gjatë Festivalit të Pranverës, duke treguar gëzim dhe nuk ka kuptim tjetër.\n\nPër shkak se M2.1 është një version me një defekt dhe aftësi logjike jashtëzakonisht të ulët, krahasimi ndërmjet gjeneratave M2 dhe M2.5 do të bëhet vetëm më poshtë.\n\n## Përmirësime\n\n- Arsyetim i qëndrueshëm: M2.5 mund të ruajë kufizimet fillestare dhe detajet e kontekstit gjatë një procesi më të gjatë arsyetimi, kështu që disa probleme që nuk janë shumë të vështira, por kërkojnë

Published in Technology

You Might Also Like

Si të përdorni teknologjinë e cloud computing: Udhëzuesi i plotë për ndërtimin e infrastrukturës tuaj të parë në cloud

Si të përdorni teknologjinë e cloud computing: Udhëzuesi i plotë për ndërtimin e infrastrukturës tuaj të parë në cloud

[[HTMLPLACEHOLDER0]] [[HTMLPLACEHOLDER1]] [[HTMLPLACEHOLDER2]] [[HTMLPLACEHOLDER3]] [[HTMLPLACEHOLDER4]] [[HTMLPLACEHOLD...

Paralajmërim! Babai i Claude Code thotë: Pas një muaji, nuk do të përdoret më Plan Mode, titulli i inxhinierit të softuerit do të zhduket

Paralajmërim! Babai i Claude Code thotë: Pas një muaji, nuk do të përdoret më Plan Mode, titulli i inxhinierit të softuerit do të zhduket

Paralajmërim! Babai i Claude Code thotë: Pas një muaji, nuk do të përdoret më Plan Mode, titulli i inxhinierit të softue...

2026年 Top 10 深度学习资源推荐

2026年 Top 10 深度学习资源推荐

2026年 Top 10 深度学习资源推荐 Me zhvillimin e shpejtë të mësimit të thellë në fusha të ndryshme, po shfaqen gjithnjë e më shumë ...

2026 Top 10 AI Agjentët: Analiza e Pikat Kryesore

2026 Top 10 AI Agjentët: Analiza e Pikat Kryesore

2026 Top 10 AI Agjentët: Analiza e Pikat Kryesore Hyrje Me zhvillimin e shpejtë të inteligjencës artificiale, agjentët A...

2026 Top 10 AI Tools Recommendations: Unleashing the True Potential of Artificial Intelligence

2026 Top 10 AI Tools Recommendations: Unleashing the True Potential of Artificial Intelligence

2026 Top 10 AI Tools Recommendations: Unleashing the True Potential of Artificial Intelligence Në epokën e zhvillimit të...

2026年 Top 10 AWS工具和资源推荐

2026年 Top 10 AWS工具和资源推荐

2026年 Top 10 AWS工具和资源推荐 Në fushën e shpejtë të zhvillimit të kompjuterëve në re, Amazon Web Services (AWS) ka qenë lider...