Ei mingit parameetrite häälestamist, ainult koodi kirjutamine! Jeff Clune'i meeskonna uus teos: Meta Agent arendab automaatselt mälumooduleid
Ei mingit parameetrite häälestamist, ainult koodi kirjutamine! Jeff Clune'i meeskonna uus teos: Meta Agent arendab automaatselt mälumooduleid
Teel Software 3.0 poole, AI hakkab ise Pythoni koodi kirjutama, et aju arendada.

Agentide arenduse sügavustes on mälu (Memory) alati olnud vältimatu valupunkt.
Kuigi põhimudelite võimekus on üha suurem, on need järelduste tegemise protsessis sisuliselt olekuta (Stateless), mis piirab Agendi võimet pidevalt kogemusi koguda.
Praegu on tööstuses mälu käsitlemise peamised lahendused, olgu need siis RAG või libiseva akna kokkuvõtted, sisuliselt ikka veel käsitsi kujundatud heuristiliste reeglite etapis.
Sellised käsitsi valmistatud mälumoodulid on äärmiselt haprad ja raskesti ülekantavad. Dialoogsüsteemide jaoks hoolikalt häälestatud Prompt ja otsinguloogika kaotavad sageli oma mõju pikaajalise planeerimise ülesannetes (nagu ALFWorld) või keerulistes strateegiamängudes.

Sellele probleemile on UBC professor ja endine OpenAI teadur Jeff Clune'i meeskond pakkunud geek'ilikku lahendust.
Kuna me ei tea, milline mälustruktuur on parim, siis las Agent kirjutab ise Pythoni koodi, et seda kujundada.
See ongi äsja avaldatud ALMA (Automated meta-Learning of Memory designs for Agentic systems).
ADAS-ist ALMA-ni: Koodipõhine automatiseeritud disain
ALMA on selle meeskonna hiljutise AI genereerimise algoritmide tehnilise suuna jätk.

ADAS-is (Automated Design of Agentic Systems) tõestas meeskond, et Agendi arhitektuuri kujundamisel on kood tõhusam otsinguruum kui närvivõrgu kaalud või Soft Prompts. Kood on Turingi-täielik ja väga hästi seletatav.

Seejärel, DGM-is (Darwin Gödel Machine), tutvustas meeskond evolutsiooniliste algoritmide avatud uurimise kontseptsiooni, säilitades disainiarhiivi, et julgustada mudelit uurima uudseid lahendusi.

ALMA päris ADAS-i koodi genereerimise paradigma ja DGM-i evolutsioonistrateegia, keskendudes rakendusstsenaariumidele Agendi süsteemides, mis sõltuvad kõige rohkem inimkogemusest – mälust.
ALMA tööpõhimõte
ALMA töömehhanism on standardne meta-õppe suletud ahel. Meta Agent ei tegele enam otse ülesannetega, vaid vastutab programmeerimise eest. Protsess koosneb neljast etapist:
- Idee: Analüüsib praegust mälukujunduse arhiivi, genereerides ajaloolise jõudluse põhjal parendusettepanekuid
- Planeerimine: Muudab ideed pseudokoodi loogikaks
- Realiseerimine: Kirjutab käivitatava Pythoni koodi, määratledes põhifunktsioonid
- Hindamine: Rakendab genereeritud koodi liivakasti keskkonnas ülesannete täitmiseks, tagasiside jõudlusnäitajatega

Evolutsiooni käigus genereerib ALMA tohutu disainipuu. Iteratsioonide arvu suurenemisega areneb genereeritud mälukood järk-järgult lihtsast salvestusloogikast keerukaks kognitiivseks arhitektuuriks.

Arendatud mälustruktuur
ALMA genereeritud mälukujundus näitas erinevates ülesannetes suurt varieeruvust:
- MiniHack (koopaseiklus): Kujundas Risk and Interaction mooduli, mis salvestab selgesõnaliselt verekaotuse põhjustavad toimingud ja koletiste agressiivsuse
- Baba Is AI (loogikamõistatus): Kujundas Strategy Library, mis salvestab taseme läbimiseks vajalikud reeglite kombinatsioonid

See näitab, et AI suudab tuvastada ülesande omadusi: ellujäämismängud peavad keskenduma riskidele, mõistatusmängud aga reeglite abstraktsioonile.
Katsetulemused
ALMA-t võrreldi peamiste baasjoontega neljas keskkonnas: TextWorld, ALFWorld, MiniHack, Baba Is AI.
GPT-5-mini mudelil saavutas ALMA keskmise edukuse määra 53,9%, mis on parem kui G-Memory (46,0%) ja Trajectory Retrieval (48,6%).

Kuluefektiivsuse osas kulutas ALMA keskmiselt vaid 1319 tokenit, samas kui Trajectory Retrieval kulutas koguni 9149 tokenit ja G-Memory ulatus 6055 tokenini. ALMA saavutas parema jõudluse vaid umbes 1/7 kuni 1/5 kuluga.

Kokkuvõte
ALMA näitab võimalust üleminekuks Software 2.0-lt (Neural Networks) Software 3.0-le (AI-Generating Algorithms).
Agentide arenduses on mälumoodulite disain pikka aega sõltunud inseneride intuitsioonist. ALMA tõestas, et meta-õppe ja koodi genereerimise abil suudab AI konkreetse keskkonna põhjal automaatselt leida optimaalse mäluarhitektuuri.
Ressursilingid
- Artikkel: https://arxiv.org/pdf/2602.07755
- Kood: https://github.com/zksha/alma
- Projekti koduleht: https://yimingxiong.me/alma





