Pa rregullime, vetëm shkruaj kod! Vepra e re e ekipit të Jeff Clune: Moduli i memories automatike të evoluar të Meta Agent
Pa rregullime, vetëm shkruaj kod! Vepra e re e ekipit të Jeff Clune: Moduli i memories automatike të evoluar të Meta Agent
Duke shkuar drejt Software 3.0, AI fillon të shkruajë vetë kodin Python për të evoluar trurin.

Në zonën e thellë të zhvillimit të Agent, kujtesa (Memory) është gjithmonë një pikë e dhimbshme që nuk mund të anashkalohet.
Megjithëse aftësitë e modeleve bazë po bëhen gjithnjë e më të forta, ato janë në thelb pa gjendje (Stateless) në procesin e arsyetimit, gjë që kufizon aftësinë e Agent për të grumbulluar vazhdimisht përvojë.
Aktualisht, zgjidhja kryesore e industrisë për trajtimin e kujtesës, qoftë RAG apo përmbledhja e dritares rrëshqitëse, në thelb mbetet në fazën e rregullave heuristike të dizajnuara nga njeriu.
Ky modul kujtese i krijuar manualisht është jashtëzakonisht i brishtë dhe i vështirë për t'u transferuar. Prompt dhe logjika e marrjes e rregulluar me kujdes për sistemet e dialogut shpesh dështojnë drejtpërdrejt kur vendosen në detyra planifikimi afatgjatë (si ALFWorld) ose lojëra komplekse strategjike.

Përballë këtij ngërçi, ekipi i profesorit të UBC-së dhe ish-studiuesit të OpenAI, Jeff Clune, dha një zgjidhje geek.
Meqenëse nuk e dimë se cila strukturë kujtese është më e mira, atëherë le të shkruajë vetë Agent kodi Python për ta dizajnuar.
Ky është ALMA (Automated meta-Learning of Memory designs for Agentic systems) i sapo publikuar.
Nga ADAS në ALMA: Dizajn automatik i bazuar në kod
ALMA është një vazhdim i rrugës teknike të algoritmit të gjenerimit të AI të promovuar kohët e fundit nga ekipi.

Në ADAS (Automated Design of Agentic Systems), ekipi vërtetoi se kodi është një hapësirë kërkimi më efikase se peshat e rrjetit nervor ose Soft Prompts kur dizajnohet arkitektura e Agent. Kodi ka plotësinë e Turingut dhe ka shpjegueshmëri të fortë.

Më pas, në DGM (Darwin Gödel Machine), ekipi prezantoi konceptin e eksplorimit të hapur në algoritmet evolucionare, duke mbajtur një arkiv dizajni dhe duke inkurajuar modelin të eksplorojë zgjidhje të reja.

ALMA trashëgon paradigmën e gjenerimit të kodit të ADAS dhe strategjinë evolucionare të DGM, duke u fokusuar në komponentin më të varur nga përvoja njerëzore në sistemin Agent - kujtesën.
Mekanizmi i punës i ALMA
Mekanizmi i funksionimit të ALMA është një lak standard meta-mësimi. Meta Agent nuk merret më drejtpërdrejt me detyrat, por është përgjegjës për programimin. Procesi përfshin katër faza:
- Konceptimi: Analizoni arkivin aktual të dizajnit të kujtesës dhe konceptoni zgjidhje të përmirësuara bazuar në performancën historike
- Planifikimi: Kthejeni konceptin në logjikë pseudo-kodi
- Realizimi: Shkruani kodin Python të ekzekutueshëm, përcaktoni funksionet thelbësore
- Vlerësimi: Vendosni kodin e gjeneruar në një mjedis sandbox për të ekzekutuar detyra dhe për të dhënë reagime mbi treguesit e performancës

Në procesin e evolucionit, ALMA do të gjenerojë një pemë të madhe dizajni. Me rritjen e numrit të hapave të përsëritjes, kodi i kujtesës së gjeneruar gradualisht evoluon nga logjika e thjeshtë e ruajtjes në një arkitekturë komplekse njohëse.

Struktura e kujtesës e evoluar
Dizajni i kujtesës i gjeneruar nga ALMA ka treguar dallime të mëdha në detyra të ndryshme:
- MiniHack (Eksplorimi i birucave): Dizajnoi modulin Risk and Interaction, duke regjistruar në mënyrë eksplicite operacionet që çojnë në humbje gjaku dhe agresivitetin e përbindëshave
- Baba Is AI (Enigma logjike): Dizajnoi Strategy Library, duke regjistruar kombinimet e rregullave të nevojshme për të kaluar nivelet

Kjo tregon se AI është në gjendje të identifikojë karakteristikat e detyrës: lojërat e mbijetesës duhet t'i kushtojnë vëmendje rrezikut, ndërsa lojërat e enigmës duhet t'i kushtojnë vëmendje abstraksionit të rregullave.
Rezultatet eksperimentale
ALMA u krahasua me bazat kryesore në katër mjedise: TextWorld, ALFWorld, MiniHack, Baba Is AI.
Në modelin GPT-5-mini, shkalla mesatare e suksesit të ALMA arriti në 53.9%, që është më e mirë se G-Memory (46.0%) dhe Trajectory Retrieval (48.6%).

Për sa i përket efikasitetit të kostos, ALMA konsumon mesatarisht vetëm 1,319 tokens, ndërsa Trajectory Retrieval konsumon deri në 9,149 tokens, dhe G-Memory gjithashtu arrin në 6,055 tokens. ALMA shkëmbeu performancë më të mirë me vetëm rreth 1/7 deri në 1/5 të kostos.

Përfundim
ALMA tregon një mundësi për një tranzicion nga Software 2.0 (Rrjetet nervore) në Software 3.0 (Algoritmet gjeneruese të AI).
Në zhvillimin e Agent, dizajni i moduleve të kujtesës ka qenë prej kohësh i varur nga intuita e inxhinierëve. ALMA vërtetoi se përmes meta-mësimit dhe gjenerimit të kodit, AI është në gjendje të zbulojë automatikisht arkitekturën optimale të kujtesës sipas mjedisit specifik.
Lidhje burimesh
- Punimi: https://arxiv.org/pdf/2602.07755
- Kodi: https://github.com/zksha/alma
- Faqja kryesore e projektit: https://yimingxiong.me/alma





