Ei mingit parameetrite häälestamist, ainult koodi kirjutamine! Jeff Clune'i meeskonna uus teos: Meta Agent arendab automaatselt mälumooduleid

2/14/2026
3 min read

Ei mingit parameetrite häälestamist, ainult koodi kirjutamine! Jeff Clune'i meeskonna uus teos: Meta Agent arendab automaatselt mälumooduleid

Teel Software 3.0 poole, AI hakkab ise Pythoni koodi kirjutama, et aju arendada.

ALMA

Agentide arenduse sügavustes on mälu (Memory) alati olnud vältimatu valupunkt.

Kuigi põhimudelite võimekus on üha suurem, on need järelduste tegemise protsessis sisuliselt olekuta (Stateless), mis piirab Agendi võimet pidevalt kogemusi koguda.

Praegu on tööstuses mälu käsitlemise peamised lahendused, olgu need siis RAG või libiseva akna kokkuvõtted, sisuliselt ikka veel käsitsi kujundatud heuristiliste reeglite etapis.

Sellised käsitsi valmistatud mälumoodulid on äärmiselt haprad ja raskesti ülekantavad. Dialoogsüsteemide jaoks hoolikalt häälestatud Prompt ja otsinguloogika kaotavad sageli oma mõju pikaajalise planeerimise ülesannetes (nagu ALFWorld) või keerulistes strateegiamängudes.

ALMA arhitektuur

Sellele probleemile on UBC professor ja endine OpenAI teadur Jeff Clune'i meeskond pakkunud geek'ilikku lahendust.

Kuna me ei tea, milline mälustruktuur on parim, siis las Agent kirjutab ise Pythoni koodi, et seda kujundada.

See ongi äsja avaldatud ALMA (Automated meta-Learning of Memory designs for Agentic systems).

ADAS-ist ALMA-ni: Koodipõhine automatiseeritud disain

ALMA on selle meeskonna hiljutise AI genereerimise algoritmide tehnilise suuna jätk.

ADAS

ADAS-is (Automated Design of Agentic Systems) tõestas meeskond, et Agendi arhitektuuri kujundamisel on kood tõhusam otsinguruum kui närvivõrgu kaalud või Soft Prompts. Kood on Turingi-täielik ja väga hästi seletatav.

Meta Agent

Seejärel, DGM-is (Darwin Gödel Machine), tutvustas meeskond evolutsiooniliste algoritmide avatud uurimise kontseptsiooni, säilitades disainiarhiivi, et julgustada mudelit uurima uudseid lahendusi.

DGM

ALMA päris ADAS-i koodi genereerimise paradigma ja DGM-i evolutsioonistrateegia, keskendudes rakendusstsenaariumidele Agendi süsteemides, mis sõltuvad kõige rohkem inimkogemusest – mälust.

ALMA tööpõhimõte

ALMA töömehhanism on standardne meta-õppe suletud ahel. Meta Agent ei tegele enam otse ülesannetega, vaid vastutab programmeerimise eest. Protsess koosneb neljast etapist:

  • Idee: Analüüsib praegust mälukujunduse arhiivi, genereerides ajaloolise jõudluse põhjal parendusettepanekuid
  • Planeerimine: Muudab ideed pseudokoodi loogikaks
  • Realiseerimine: Kirjutab käivitatava Pythoni koodi, määratledes põhifunktsioonid
  • Hindamine: Rakendab genereeritud koodi liivakasti keskkonnas ülesannete täitmiseks, tagasiside jõudlusnäitajatega

Töövoog

Evolutsiooni käigus genereerib ALMA tohutu disainipuu. Iteratsioonide arvu suurenemisega areneb genereeritud mälukood järk-järgult lihtsast salvestusloogikast keerukaks kognitiivseks arhitektuuriks.

Evolutsioonipuu

Arendatud mälustruktuur

ALMA genereeritud mälukujundus näitas erinevates ülesannetes suurt varieeruvust:

  • MiniHack (koopaseiklus): Kujundas Risk and Interaction mooduli, mis salvestab selgesõnaliselt verekaotuse põhjustavad toimingud ja koletiste agressiivsuse
  • Baba Is AI (loogikamõistatus): Kujundas Strategy Library, mis salvestab taseme läbimiseks vajalikud reeglite kombinatsioonid

Mälustruktuur

See näitab, et AI suudab tuvastada ülesande omadusi: ellujäämismängud peavad keskenduma riskidele, mõistatusmängud aga reeglite abstraktsioonile.

Katsetulemused

ALMA-t võrreldi peamiste baasjoontega neljas keskkonnas: TextWorld, ALFWorld, MiniHack, Baba Is AI.

GPT-5-mini mudelil saavutas ALMA keskmise edukuse määra 53,9%, mis on parem kui G-Memory (46,0%) ja Trajectory Retrieval (48,6%).

Katsetulemused

Kuluefektiivsuse osas kulutas ALMA keskmiselt vaid 1319 tokenit, samas kui Trajectory Retrieval kulutas koguni 9149 tokenit ja G-Memory ulatus 6055 tokenini. ALMA saavutas parema jõudluse vaid umbes 1/7 kuni 1/5 kuluga.

Kuluefektiivsus

Kokkuvõte

ALMA näitab võimalust üleminekuks Software 2.0-lt (Neural Networks) Software 3.0-le (AI-Generating Algorithms).

Agentide arenduses on mälumoodulite disain pikka aega sõltunud inseneride intuitsioonist. ALMA tõestas, et meta-õppe ja koodi genereerimise abil suudab AI konkreetse keskkonna põhjal automaatselt leida optimaalse mäluarhitektuuri.

Ressursilingid

Published in Technology

You Might Also Like