Bez podešavanja parametara, samo pisanje koda! Novi rad tima Jeffa Clunea: Meta Agent automatski evoluira memorijske module

Na putu prema Software 3.0, AI počinje sam pisati Python kod kako bi evoluirao mozak.

ALMA

U dubokim vodama razvoja Agenta, memorija (Memory) je uvijek bolna tačka koju je nemoguće zaobići.

Iako su mogućnosti osnovnih modela sve jače, u procesu zaključivanja suštinski su bez stanja (Stateless), što ograničava sposobnost Agenta da kontinuirano akumulira iskustvo.

Trenutno, glavna rješenja u industriji za obradu memorije, bilo da se radi o RAG-u ili sažimanju kliznog prozora, suštinski ostaju u fazi heurističkih pravila dizajniranih ručno.

Ovakvi ručno izrađeni memorijski moduli su izuzetno krhki i teško ih je prenijeti. Prompts i logika pretraživanja pažljivo podešeni za sisteme za dijalog često će direktno otkazati kada se stave u zadatke dugoročnog planiranja (kao što je ALFWorld) ili složene strateške igre.

ALMA arhitektura

Kao odgovor na ovu dilemu, tim profesora UBC-a i bivšeg istraživača OpenAI-a, Jeffa Clunea, dao je geekovsko rješenje.

Budući da ne znamo koja je memorijska struktura najbolja, neka Agent sam piše Python kod da je dizajnira.

To je upravo objavljeni ALMA (Automated meta-Learning of Memory designs for Agentic systems).

Od ADAS-a do ALMA-e: Automatizirani dizajn zasnovan na kodu

ALMA je nastavak tehnološkog puta AI generisanih algoritama koje tim nedavno promoviše.

ADAS

U ADAS (Automated Design of Agentic Systems), tim je dokazao da je kod efikasniji prostor pretrage od neuronskih mreža ili Soft Prompts pri dizajniranju arhitekture Agenta. Kod ima Turingovu potpunost i izuzetnu interpretabilnost.

Meta Agent

Kasnije, u DGM (Darwin Gödel Machine), tim je uveo koncept otvorene eksploracije iz evolucijskih algoritama, održavajući arhivu dizajna i ohrabrujući model da istražuje nova rješenja.

DGM

ALMA nasljeđuje ADAS-ovu paradigmu generisanja koda i DGM-ovu evolucijsku strategiju, fokusirajući se na komponente Agent sistema koje najviše zavise od ljudskog iskustva - memoriju.

Kako ALMA radi

Mehanizam rada ALMA-e je standardna meta-learning petlja. Meta Agent više ne obrađuje direktno zadatke, već je odgovoran za programiranje. Proces uključuje četiri faze:

Koncept: Analizira trenutnu arhivu dizajna memorije i, na osnovu istorijskih performansi, osmišljava planove za poboljšanje
Planiranje: Pretvara koncept u logiku pseudokoda
Implementacija: Piše izvršni Python kod, definišući osnovne funkcije
Procjena: Postavlja generisani kod u sandbox okruženje za izvršavanje zadataka i vraća metrike performansi

Radni proces

U procesu evolucije, ALMA će generisati ogromno stablo dizajna. Kako se broj iteracija povećava, generisani memorijski kod postepeno evoluira od jednostavne logike skladištenja do složene kognitivne arhitekture.

Evolucijsko stablo

Evoluirane memorijske strukture

Memorijski dizajni koje je generisala ALMA pokazali su ogromne razlike u različitim zadacima:

MiniHack (istraživanje tamnice): Dizajniran je Risk and Interaction modul, koji eksplicitno bilježi operacije koje dovode do gubitka zdravlja i agresivnost čudovišta
Baba Is AI (logička zagonetka): Dizajnirana je Strategy Library, koja bilježi kombinacije pravila potrebne za prolazak nivoa

Memorijska struktura

Ovo pokazuje da AI može prepoznati karakteristike zadatka: igre preživljavanja moraju obratiti pažnju na rizik, a igre zagonetke moraju obratiti pažnju na apstrakciju pravila.

Rezultati eksperimenta

ALMA je upoređena sa glavnim osnovnim linijama u četiri okruženja: TextWorld, ALFWorld, MiniHack, Baba Is AI.

Na GPT-5-mini modelu, prosječna stopa uspješnosti ALMA-e dostigla je 53.9%, što je bolje od G-Memory (46.0%) i Trajectory Retrieval (48.6%).

Rezultati eksperimenta

U pogledu troškovne efikasnosti, ALMA u prosjeku troši samo 1,319 tokena, dok Trajectory Retrieval troši čak 9,149 tokena, a G-Memory dostiže 6,055 tokena. ALMA je postigla bolje performanse uz samo oko 1/7 do 1/5 troškova.

Troškovna efikasnost

Zaključak

ALMA pokazuje mogućnost prelaska sa Software 2.0 (Neural Networks) na Software 3.0 (AI-Generating Algorithms).

U razvoju Agenta, dizajn memorijskih modula dugo se oslanjao na intuiciju inženjera. ALMA je dokazala da, kroz meta-learning i generisanje koda, AI može automatski otkriti optimalnu memorijsku arhitekturu u zavisnosti od specifičnog okruženja.

Linkovi resursa

Rad: https://arxiv.org/pdf/2602.07755
Kod: https://github.com/zksha/alma
Početna stranica projekta: https://yimingxiong.me/alma

Bez podešavanja parametara, samo pisanje koda! Novi rad tima Jeffa Clunea: Meta Agent automatski evoluira memorijske module

Bez podešavanja parametara, samo pisanje koda! Novi rad tima Jeffa Clunea: Meta Agent automatski evoluira memorijske module

Od ADAS-a do ALMA-e: Automatizirani dizajn zasnovan na kodu

Kako ALMA radi

Evoluirane memorijske strukture

Rezultati eksperimenta

Zaključak

Linkovi resursa

You Might Also Like

Claude Code Buddy izmjena vodič: Kako dobiti sjajnog legendarno ljubimca

Obsidian je lansirao Defuddle, podižući Obsidian Web Clipper na novu visinu

OpenAI iznenada najavljuje "tri u jedan": spajanje preglednika + programiranja + ChatGPT, unutrašnje priznanje da su prošle godine pogriješili

2026, ne prisiljavaj se na "disciplinu"! Učini ovih 8 malih stvari, zdravlje će doći prirodno

One of the reasons why mothers who struggle to lose weight fail

AI Browser 24小时稳定运行指南