Bez parametru regulēšanas, tikai koda rakstīšana! Jeff Clune komandas jaunais darbs: Meta Agent automātiski attīsta atmiņas moduļus
Bez parametru regulēšanas, tikai koda rakstīšana! Jeff Clune komandas jaunais darbs: Meta Agent automātiski attīsta atmiņas moduļus
Ceļā uz Software 3.0, AI sāk pats rakstīt Python kodu, lai attīstītu smadzenes.

Agentu izstrādes dziļajos ūdeņos atmiņa (Memory) vienmēr ir sāpīgs punkts, no kura nevar izvairīties.
Lai gan pamata modeļu spējas kļūst arvien spēcīgākas,推理procesā tās būtībā ir bezstāvokļa (Stateless), kas ierobežo Agentu spēju nepārtraukti uzkrāt pieredzi.
Pašlaik nozares galvenie atmiņas apstrādes risinājumi, neatkarīgi no tā, vai tie ir RAG vai slīdošā loga kopsavilkumi, būtībā joprojām atrodas cilvēku izstrādātu heiristisku noteikumu stadijā.
Šis manuāli izveidotais atmiņas modulis ir ārkārtīgi trausls un grūti pārnesams. Dialogu sistēmām rūpīgi noregulētie Prompt un meklēšanas loģika bieži vien tieši zaudē spēku, ja tos ievieto tālsatiksmes plānošanas uzdevumos (piemēram, ALFWorld) vai sarežģītās stratēģijas spēlēs.

Lai atrisinātu šo problēmu, UBC profesors un bijušais OpenAI pētnieks Jeff Clune komanda piedāvāja ģeniālu risinājumu.
Tā kā nav zināms, kāda atmiņas struktūra ir vislabākā, ļaujiet Agentam pašam rakstīt Python kodu, lai to izstrādātu.
Tas ir tikko izlaistais ALMA (Automated meta-Learning of Memory designs for Agentic systems).
No ADAS līdz ALMA: uz kodu balstīta automatizēta projektēšana
ALMA ir šīs komandas nesen popularizētā AI ģenerēšanas algoritmu tehnoloģiju virziena turpinājums.

ADAS (Automated Design of Agentic Systems) komanda pierādīja, ka, izstrādājot Agentu arhitektūru, kods ir efektīvāka meklēšanas telpa nekā neironu tīkla svars vai Soft Prompts. Kods ir Turing pilnīgs un tam ir ārkārtīgi augsta skaidrojuma pakāpe.

Vēlāk DGM (Darwin Gödel Machine) komanda ieviesa atvērtās izpētes koncepciju no evolūcijas algoritmiem, uzturot dizaina arhīvu, lai mudinātu modeli izpētīt jaunus risinājumus.

ALMA manto ADAS koda ģenerēšanas paradigmu un DGM evolūcijas stratēģiju, koncentrējot lietojuma scenārijus uz Agentu sistēmu komponentu, kas visvairāk atkarīga no cilvēku pieredzes - atmiņu.
ALMA darbības mehānisms
ALMA darbības mehānisms ir standarta meta-mācīšanās slēgta cilpa. Meta Agent vairs tieši neapstrādā uzdevumus, bet ir atbildīgs par programmēšanu. Process ietver četras fāzes:
- Idejas ģenerēšana: analizējiet pašreizējo atmiņas dizaina arhīvu un ģenerējiet uzlabojumu plānus, pamatojoties uz vēsturisko sniegumu
- Plānošana: pārvērtiet idejas pseidokoda loģikā
- Īstenošana: rakstiet izpildāmu Python kodu, definējiet galvenās funkcijas
- Novērtēšana: izvietojiet ģenerēto kodu smilšu kastē, lai izpildītu uzdevumus, un atgrieziet veiktspējas rādītājus

Evolūcijas procesā ALMA ģenerēs milzīgu dizaina koku. Palielinoties iterāciju skaitam, ģenerētais atmiņas kods pakāpeniski attīstās no vienkāršas krātuves loģikas līdz sarežģītai kognitīvai arhitektūrai.

Attīstītās atmiņas struktūras
ALMA ģenerētie atmiņas dizaini dažādos uzdevumos uzrādīja ārkārtīgas atšķirības:
- MiniHack (dungeon exploration): izstrādāja Risk and Interaction moduli, kas skaidri reģistrē darbības, kas izraisa asins zudumu, un monstru agresivitāti
- Baba Is AI (loģikas mīklu risināšana): izstrādāja Strategy Library, kas reģistrē noteikumu kombinācijas, kas nepieciešamas, lai izietu līmeni

Tas norāda, ka AI var identificēt uzdevuma īpašības: izdzīvošanas spēlēm jākoncentrējas uz risku, un mīklu spēlēm jākoncentrējas uz noteikumu abstrakciju.
Eksperimentu rezultāti
ALMA tika salīdzināta ar galvenajām bāzes līnijām četros vidēs: TextWorld, ALFWorld, MiniHack, Baba Is AI.
GPT-5-mini modelī ALMA vidējais panākumu līmenis sasniedza 53.9%, kas ir labāks nekā G-Memory (46.0%) un Trajectory Retrieval (48.6%).

Attiecībā uz izmaksu efektivitāti ALMA vidēji patērē tikai 1,319 tokens, savukārt Trajectory Retrieval patērē līdz pat 9,149 tokens, un G-Memory sasniedza 6,055 tokens. ALMA ieguva labāku veiktspēju ar tikai aptuveni 1/7 līdz 1/5 no izmaksām.

Secinājums
ALMA parāda iespēju pāriet no Software 2.0 (Neironu tīkli) uz Software 3.0 (AI ģenerēšanas algoritmi).
Agentu izstrādē atmiņas moduļu dizains ilgu laiku ir bijis atkarīgs no inženieru intuīcijas. ALMA pierādīja, ka, izmantojot meta-mācīšanos un koda ģenerēšanu, AI var automātiski atrast optimālo atmiņas arhitektūru atkarībā no konkrētās vides.
Resursu saites
- Raksts: https://arxiv.org/pdf/2602.07755
- Kods: https://github.com/zksha/alma
- Projekta mājaslapa: https://yimingxiong.me/alma





