Pa rregullime, vetëm shkruaj kod! Vepra e re e ekipit të Jeff Clune: Moduli i memories automatike të evoluar të Meta Agent

2/14/2026
4 min read

Pa rregullime, vetëm shkruaj kod! Vepra e re e ekipit të Jeff Clune: Moduli i memories automatike të evoluar të Meta Agent

Duke shkuar drejt Software 3.0, AI fillon të shkruajë vetë kodin Python për të evoluar trurin.

ALMA

Në zonën e thellë të zhvillimit të Agent, kujtesa (Memory) është gjithmonë një pikë e dhimbshme që nuk mund të anashkalohet.

Megjithëse aftësitë e modeleve bazë po bëhen gjithnjë e më të forta, ato janë në thelb pa gjendje (Stateless) në procesin e arsyetimit, gjë që kufizon aftësinë e Agent për të grumbulluar vazhdimisht përvojë.

Aktualisht, zgjidhja kryesore e industrisë për trajtimin e kujtesës, qoftë RAG apo përmbledhja e dritares rrëshqitëse, në thelb mbetet në fazën e rregullave heuristike të dizajnuara nga njeriu.

Ky modul kujtese i krijuar manualisht është jashtëzakonisht i brishtë dhe i vështirë për t'u transferuar. Prompt dhe logjika e marrjes e rregulluar me kujdes për sistemet e dialogut shpesh dështojnë drejtpërdrejt kur vendosen në detyra planifikimi afatgjatë (si ALFWorld) ose lojëra komplekse strategjike.

ALMA架构

Përballë këtij ngërçi, ekipi i profesorit të UBC-së dhe ish-studiuesit të OpenAI, Jeff Clune, dha një zgjidhje geek.

Meqenëse nuk e dimë se cila strukturë kujtese është më e mira, atëherë le të shkruajë vetë Agent kodi Python për ta dizajnuar.

Ky është ALMA (Automated meta-Learning of Memory designs for Agentic systems) i sapo publikuar.

Nga ADAS në ALMA: Dizajn automatik i bazuar në kod

ALMA është një vazhdim i rrugës teknike të algoritmit të gjenerimit të AI të promovuar kohët e fundit nga ekipi.

ADAS

ADAS (Automated Design of Agentic Systems), ekipi vërtetoi se kodi është një hapësirë kërkimi më efikase se peshat e rrjetit nervor ose Soft Prompts kur dizajnohet arkitektura e Agent. Kodi ka plotësinë e Turingut dhe ka shpjegueshmëri të fortë.

Meta Agent

Më pas, në DGM (Darwin Gödel Machine), ekipi prezantoi konceptin e eksplorimit të hapur në algoritmet evolucionare, duke mbajtur një arkiv dizajni dhe duke inkurajuar modelin të eksplorojë zgjidhje të reja.

DGM

ALMA trashëgon paradigmën e gjenerimit të kodit të ADAS dhe strategjinë evolucionare të DGM, duke u fokusuar në komponentin më të varur nga përvoja njerëzore në sistemin Agent - kujtesën.

Mekanizmi i punës i ALMA

Mekanizmi i funksionimit të ALMA është një lak standard meta-mësimi. Meta Agent nuk merret më drejtpërdrejt me detyrat, por është përgjegjës për programimin. Procesi përfshin katër faza:

  • Konceptimi: Analizoni arkivin aktual të dizajnit të kujtesës dhe konceptoni zgjidhje të përmirësuara bazuar në performancën historike
  • Planifikimi: Kthejeni konceptin në logjikë pseudo-kodi
  • Realizimi: Shkruani kodin Python të ekzekutueshëm, përcaktoni funksionet thelbësore
  • Vlerësimi: Vendosni kodin e gjeneruar në një mjedis sandbox për të ekzekutuar detyra dhe për të dhënë reagime mbi treguesit e performancës

工作流程

Në procesin e evolucionit, ALMA do të gjenerojë një pemë të madhe dizajni. Me rritjen e numrit të hapave të përsëritjes, kodi i kujtesës së gjeneruar gradualisht evoluon nga logjika e thjeshtë e ruajtjes në një arkitekturë komplekse njohëse.

进化树

Struktura e kujtesës e evoluar

Dizajni i kujtesës i gjeneruar nga ALMA ka treguar dallime të mëdha në detyra të ndryshme:

  • MiniHack (Eksplorimi i birucave): Dizajnoi modulin Risk and Interaction, duke regjistruar në mënyrë eksplicite operacionet që çojnë në humbje gjaku dhe agresivitetin e përbindëshave
  • Baba Is AI (Enigma logjike): Dizajnoi Strategy Library, duke regjistruar kombinimet e rregullave të nevojshme për të kaluar nivelet

记忆结构

Kjo tregon se AI është në gjendje të identifikojë karakteristikat e detyrës: lojërat e mbijetesës duhet t'i kushtojnë vëmendje rrezikut, ndërsa lojërat e enigmës duhet t'i kushtojnë vëmendje abstraksionit të rregullave.

Rezultatet eksperimentale

ALMA u krahasua me bazat kryesore në katër mjedise: TextWorld, ALFWorld, MiniHack, Baba Is AI.

Në modelin GPT-5-mini, shkalla mesatare e suksesit të ALMA arriti në 53.9%, që është më e mirë se G-Memory (46.0%) dhe Trajectory Retrieval (48.6%).

实验结果

Për sa i përket efikasitetit të kostos, ALMA konsumon mesatarisht vetëm 1,319 tokens, ndërsa Trajectory Retrieval konsumon deri në 9,149 tokens, dhe G-Memory gjithashtu arrin në 6,055 tokens. ALMA shkëmbeu performancë më të mirë me vetëm rreth 1/7 deri në 1/5 të kostos.

成本效率

Përfundim

ALMA tregon një mundësi për një tranzicion nga Software 2.0 (Rrjetet nervore) në Software 3.0 (Algoritmet gjeneruese të AI).

Në zhvillimin e Agent, dizajni i moduleve të kujtesës ka qenë prej kohësh i varur nga intuita e inxhinierëve. ALMA vërtetoi se përmes meta-mësimit dhe gjenerimit të kodit, AI është në gjendje të zbulojë automatikisht arkitekturën optimale të kujtesës sipas mjedisit specifik.

Lidhje burimesh

Published in Technology

You Might Also Like