Bez podešavanja parametara, samo pisanje koda! Novi rad tima Jeffa Clunea: Meta Agent automatski evoluira memorijske module

2/14/2026
4 min read

Bez podešavanja parametara, samo pisanje koda! Novi rad tima Jeffa Clunea: Meta Agent automatski evoluira memorijske module

Na putu ka Software 3.0, AI počinje sam da piše Python kod da bi evoluirao mozak.

ALMA

U dubokim vodama razvoja Agenta, memorija (Memory) je uvek bolna tačka koju ne možete zaobići.

Iako su mogućnosti osnovnih modela sve jače, oni su u suštini bez stanja (Stateless) tokom procesa zaključivanja, što ograničava sposobnost Agenta da kontinuirano akumulira iskustvo.

Trenutna glavna rešenja za obradu memorije u industriji, bilo da je to RAG ili sažimanje kliznog prozora, u suštini ostaju u fazi heurističkih pravila dizajniranih ručno.

Ovakvi ručno izrađeni memorijski moduli su izuzetno krhki i teško se prenose. Promptovi i logika pretraživanja pažljivo podešeni za sisteme za dijalog često će direktno otkazati kada se stave u zadatke dugoročnog planiranja (kao što je ALFWorld) ili složene strateške igre.

ALMA arhitektura

Da bi rešio ovaj problem, tim profesora UBC-a i bivšeg istraživača OpenAI-a, Jeffa Clunea, dao je geek rešenje.

Pošto ne znamo koja je memorijska struktura najbolja, hajde da Agent sam napiše Python kod da je dizajnira.

Ovo je upravo objavljeni ALMA (Automated meta-Learning of Memory designs for Agentic systems).

Od ADAS do ALMA: Automatizovani dizajn zasnovan na kodu

ALMA je nastavak tehničkog puta AI generisanih algoritama koje tim nedavno promoviše.

ADAS

U ADAS (Automated Design of Agentic Systems), tim je dokazao da je kod efikasniji prostor za pretragu od neuronskih mreža ili Soft Promptova pri dizajniranju arhitekture Agenta. Kod ima Turingovu potpunost i izuzetnu interpretabilnost.

Meta Agent

Kasnije, u DGM (Darwin Gödel Machine), tim je uveo koncept otvorene eksploracije iz evolutivnih algoritama, održavajući arhivu dizajna i podstičući model da istražuje nova rešenja.

DGM

ALMA nasleđuje ADAS paradigmu generisanja koda i DGM evolutivnu strategiju, fokusirajući se na komponente Agent sistema koje najviše zavise od ljudskog iskustva - memoriju.

Kako ALMA radi

ALMA radi kao standardna meta-learning zatvorena petlja. Meta Agent više ne obrađuje direktno zadatke, već je odgovoran za programiranje. Proces uključuje četiri faze:

  • Konceptualizacija: Analizirajte trenutnu arhivu dizajna memorije i osmislite planove za poboljšanje na osnovu istorijskih performansi
  • Planiranje: Pretvorite koncept u logiku pseudokoda
  • Implementacija: Napišite izvršni Python kod, definišite osnovne funkcije
  • Evaluacija: Implementirajte generisani kod u sandbox okruženje za izvršavanje zadataka i povratne informacije o indikatorima performansi

Radni tok

Tokom evolucije, ALMA će generisati ogromno stablo dizajna. Kako se broj iteracija povećava, generisani memorijski kod postepeno evoluira od jednostavne logike skladištenja do složene kognitivne arhitekture.

Evolutivno stablo

Evoluirane memorijske strukture

ALMA generisani dizajni memorije pokazuju velike razlike u različitim zadacima:

  • MiniHack (istraživanje tamnice): Dizajniran je Risk and Interaction modul, koji eksplicitno beleži operacije koje dovode do gubitka krvi i agresivnost čudovišta
  • Baba Is AI (logička zagonetka): Dizajnirana je Strategy Library, koja beleži kombinacije pravila potrebne za prolazak nivoa

Memorijska struktura

Ovo pokazuje da AI može da identifikuje karakteristike zadatka: igre preživljavanja moraju da obrate pažnju na rizik, a igre zagonetke moraju da obrate pažnju na apstrakciju pravila.

Rezultati eksperimenta

ALMA je upoređen sa glavnim osnovnim linijama u četiri okruženja: TextWorld, ALFWorld, MiniHack, Baba Is AI.

Na GPT-5-mini modelu, ALMA je postigao prosečnu stopu uspešnosti od 53.9%, što je bolje od G-Memory (46.0%) i Trajectory Retrieval (48.6%).

Rezultati eksperimenta

U pogledu efikasnosti troškova, ALMA u proseku troši samo 1,319 tokena, dok Trajectory Retrieval troši čak 9,149 tokena, a G-Memory dostiže 6,055 tokena. ALMA je postigao bolje performanse uz samo oko 1/7 do 1/5 troškova.

Efikasnost troškova

Zaključak

ALMA pokazuje mogućnost prelaska sa Software 2.0 (Neural Networks) na Software 3.0 (AI-Generating Algorithms).

U razvoju Agenta, dizajn memorijskih modula se dugo oslanjao na intuiciju inženjera. ALMA je dokazao da, kroz meta-learning i generisanje koda, AI može automatski da otkrije optimalnu memorijsku arhitekturu u zavisnosti od specifičnog okruženja.

Linkovi resursa

Published in Technology

You Might Also Like