Xiaohongshu waxay soo saartay SWE-Bench Mobile: Marka AI Agent ay wajahdo koodhka App-ka ee malaayiin isticmaalayaal ah, heerka ugu sarreeya ee guushu waa 12% oo keliya?
Xiaohongshu waxay soo saartay SWE-Bench Mobile: Marka AI Agent ay wajahdo koodhka App-ka ee malaayiin isticmaalayaal ah, heerka ugu sarreeya ee guushu waa 12% oo keliya?

Kooxda Xiaohongshu waxay soo saartay tijaabo cusub oo lagu magacaabo SWE-Bench Mobile, oo si gaar ah loogu talagalay in lagu qiimeeyo waxqabadka AI Agent ee ku saabsan koodhka dhabta ah ee codsiyada moobilka. Natiijadu waxay dhalisay fikir badan: xitaa AI Agent-ka ugu sarreeya, marka ay wajahayaan koodhka App-ka ee malaayiin isticmaalayaal ah, heerka ugu sarreeya ee guushu waa 12% oo keliya.

Waa maxay SWE-Bench Mobile?

SWE-Bench Mobile waa tijaabo lagu saxo koodhka loogu talagalay horumarinta codsiyada moobilka. Waxay ka kooban tahay hawlo saxitaan ah oo dhab ah oo ku saabsan codsiyada moobilka, taas oo u baahan AI Agent inay awood u yeeshaan:
- Fahmaan qaab-dhismeedka koodhka adag ee codsiyada moobilka
- Go'aamiyaan xididka dhibaatada
- Soo saaraan koodhka saxda ah ee saxitaanka
- Hubiyaan in saxitaanku uusan keenin dhibaatooyin cusub
Natiijooyinka Tijaabada

Inta lagu jiro tijaabada, waxqabadka dhowr AI Agent oo caan ah ayaa ahaa sida soo socota:
- Waxqabadka ugu fiican: Heerka guusha 12%
- Celcelis ahaan: Heerka guusha 5-8%
- Moodello qaar: Ku dhow heerka guusha 0%
Natiijadani aad ayay uga hooseysaa waxqabadka SWE-Bench ee dhaqameed.
Maxay u adag tahay?

Gaar ahaan koodhka codsiyada moobilka ayaa keenay caqabado dheeraad ah:
- La qabsiga dhinacyo badan: Waxay u baahan tahay in si isku mid ah loo tixgeliyo barnaamijyada iOS iyo Android
- Xiriirro isku tiirsanaan oo adag: Isku xirnaanta u dhaxaysa qaybaha codsiyada moobilka ayaa sarreeya
- Xaddidaadaha waxqabadka: Kheyraadka qalabka moobilka ayaa xaddidan, shuruudaha hagaajinta koodhka ayaa sarreeya
- Macquulnimada UI oo adag: Koodhka isdhexgalka interface-ka ayaa adag in si joogto ah loo falanqeeyo
Isbarbardhigga Tijaabooyinka Dhaqameed

Marka la barbar dhigo SWE-Bench ee dhaqameed, dhibka nooca Mobile-ka ayaa si weyn u kordhay:
- Baaxadda koodhka ayaa ka weyn
- Macquulnimada ganacsigu way ka adag tahay
- Tijaabooyinka ayaa adag in la gudbo
- Daqiiqadda macnaha guud ayaa sarreeya
Muhiimadda Warshadaha

Tijaabadani waxay muujineysaa xaddidaadaha AI Agent ee goobaha warshadaha dhabta ah. In kasta oo AI ay si degdeg ah u horumarayso dhanka abuurista koodhka, haddana waxaa weli jira waddo dheer oo loo maro marka la shaqeynayo mashaariic waaweyn oo adag.
Rajada Mustaqbalka

Soo saarista SWE-Bench Mobile waxay bixisaa halbeeg muhiim ah oo lagu cabbiro horumarinta qalabka barnaamijyada AI. Waxay na xusuusineysaa:
- Barnaamijyada AI-da caawiya waxay weli u baahan yihiin kormeer bini'aadam
- Mashaariicda adag waxay u baahan yihiin faham macnaha guud oo caqli badan
- Awoodda moodellada ayaa weli leh meel bannaan oo weyn oo lagu hagaajin karo
Xiriirinta Kheyraadka

- Warqad cilmiyeed: https://arxiv.org/abs/xxxxx
- GitHub: https://github.com/xiaohongshu/swe-bench-mobile





