Bez podešavanja parametara, samo pisanje koda! Novi rad tima Jeffa Clunea: Meta Agent automatski evoluira memorijske module
Bez podešavanja parametara, samo pisanje koda! Novi rad tima Jeffa Clunea: Meta Agent automatski evoluira memorijske module
Na putu prema Software 3.0, AI počinje sam pisati Python kod kako bi evoluirao mozak.

U dubokim vodama razvoja Agenta, memorija (Memory) je uvijek bolna tačka koju je nemoguće zaobići.
Iako su mogućnosti osnovnih modela sve jače, u procesu zaključivanja suštinski su bez stanja (Stateless), što ograničava sposobnost Agenta da kontinuirano akumulira iskustvo.
Trenutno, glavna rješenja u industriji za obradu memorije, bilo da se radi o RAG-u ili sažimanju kliznog prozora, suštinski ostaju u fazi heurističkih pravila dizajniranih ručno.
Ovakvi ručno izrađeni memorijski moduli su izuzetno krhki i teško ih je prenijeti. Prompts i logika pretraživanja pažljivo podešeni za sisteme za dijalog često će direktno otkazati kada se stave u zadatke dugoročnog planiranja (kao što je ALFWorld) ili složene strateške igre.

Kao odgovor na ovu dilemu, tim profesora UBC-a i bivšeg istraživača OpenAI-a, Jeffa Clunea, dao je geekovsko rješenje.
Budući da ne znamo koja je memorijska struktura najbolja, neka Agent sam piše Python kod da je dizajnira.
To je upravo objavljeni ALMA (Automated meta-Learning of Memory designs for Agentic systems).
Od ADAS-a do ALMA-e: Automatizirani dizajn zasnovan na kodu
ALMA je nastavak tehnološkog puta AI generisanih algoritama koje tim nedavno promoviše.

U ADAS (Automated Design of Agentic Systems), tim je dokazao da je kod efikasniji prostor pretrage od neuronskih mreža ili Soft Prompts pri dizajniranju arhitekture Agenta. Kod ima Turingovu potpunost i izuzetnu interpretabilnost.

Kasnije, u DGM (Darwin Gödel Machine), tim je uveo koncept otvorene eksploracije iz evolucijskih algoritama, održavajući arhivu dizajna i ohrabrujući model da istražuje nova rješenja.

ALMA nasljeđuje ADAS-ovu paradigmu generisanja koda i DGM-ovu evolucijsku strategiju, fokusirajući se na komponente Agent sistema koje najviše zavise od ljudskog iskustva - memoriju.
Kako ALMA radi
Mehanizam rada ALMA-e je standardna meta-learning petlja. Meta Agent više ne obrađuje direktno zadatke, već je odgovoran za programiranje. Proces uključuje četiri faze:
- Koncept: Analizira trenutnu arhivu dizajna memorije i, na osnovu istorijskih performansi, osmišljava planove za poboljšanje
- Planiranje: Pretvara koncept u logiku pseudokoda
- Implementacija: Piše izvršni Python kod, definišući osnovne funkcije
- Procjena: Postavlja generisani kod u sandbox okruženje za izvršavanje zadataka i vraća metrike performansi

U procesu evolucije, ALMA će generisati ogromno stablo dizajna. Kako se broj iteracija povećava, generisani memorijski kod postepeno evoluira od jednostavne logike skladištenja do složene kognitivne arhitekture.

Evoluirane memorijske strukture
Memorijski dizajni koje je generisala ALMA pokazali su ogromne razlike u različitim zadacima:
- MiniHack (istraživanje tamnice): Dizajniran je Risk and Interaction modul, koji eksplicitno bilježi operacije koje dovode do gubitka zdravlja i agresivnost čudovišta
- Baba Is AI (logička zagonetka): Dizajnirana je Strategy Library, koja bilježi kombinacije pravila potrebne za prolazak nivoa

Ovo pokazuje da AI može prepoznati karakteristike zadatka: igre preživljavanja moraju obratiti pažnju na rizik, a igre zagonetke moraju obratiti pažnju na apstrakciju pravila.
Rezultati eksperimenta
ALMA je upoređena sa glavnim osnovnim linijama u četiri okruženja: TextWorld, ALFWorld, MiniHack, Baba Is AI.
Na GPT-5-mini modelu, prosječna stopa uspješnosti ALMA-e dostigla je 53.9%, što je bolje od G-Memory (46.0%) i Trajectory Retrieval (48.6%).

U pogledu troškovne efikasnosti, ALMA u prosjeku troši samo 1,319 tokena, dok Trajectory Retrieval troši čak 9,149 tokena, a G-Memory dostiže 6,055 tokena. ALMA je postigla bolje performanse uz samo oko 1/7 do 1/5 troškova.

Zaključak
ALMA pokazuje mogućnost prelaska sa Software 2.0 (Neural Networks) na Software 3.0 (AI-Generating Algorithms).
U razvoju Agenta, dizajn memorijskih modula dugo se oslanjao na intuiciju inženjera. ALMA je dokazala da, kroz meta-learning i generisanje koda, AI može automatski otkriti optimalnu memorijsku arhitekturu u zavisnosti od specifičnog okruženja.
Linkovi resursa
- Rad: https://arxiv.org/pdf/2602.07755
- Kod: https://github.com/zksha/alma
- Početna stranica projekta: https://yimingxiong.me/alma





