Bez ladění parametrů, jen psaní kódu! Nová práce týmu Jeffa Clunea: Meta Agent automaticky vyvíjí paměťové moduly
Bez ladění parametrů, jen psaní kódu! Nová práce týmu Jeffa Clunea: Meta Agent automaticky vyvíjí paměťové moduly
Cesta k Software 3.0, AI začíná sama psát Python kód a vyvíjet mozek.

V hlubokých vodách vývoje Agentů je paměť (Memory) vždy bolestivým bodem, kterému se nelze vyhnout.
I když jsou schopnosti základních modelů stále silnější, v procesu odvozování jsou v podstatě bezstavové (Stateless), což omezuje schopnost Agenta neustále akumulovat zkušenosti.
Současné hlavní řešení pro zpracování paměti v průmyslu, ať už RAG nebo shrnutí posuvného okna, v podstatě stále zůstávají ve fázi heuristických pravidel navržených lidmi.
Tento ručně vytvořený paměťový modul je extrémně křehký a obtížně přenositelný. Pečlivě vyladěné Prompty a vyhledávací logika pro dialogové systémy často selžou, jakmile jsou umístěny do úloh dlouhodobého plánování (jako je ALFWorld) nebo složitých strategických her.

S ohledem na tuto obtížnou situaci tým profesora UBC a bývalého výzkumníka OpenAI Jeffa Clunea přišel s geekovským řešením.
Protože nevíme, jaká paměťová struktura je nejlepší, nechme Agenta, ať si sám napíše Python kód pro její návrh.
To je právě vydaný ALMA (Automated meta-Learning of Memory designs for Agentic systems).
Od ADAS k ALMA: Automatizovaný návrh založený na kódu
ALMA je pokračováním technologické cesty algoritmů generovaných AI, kterou tento tým nedávno prosazoval.

V ADAS (Automated Design of Agentic Systems) tým prokázal, že při navrhování architektury Agenta je kód efektivnější vyhledávací prostor než váhy neuronové sítě nebo Soft Prompts. Kód má Turingovu úplnost a silnou interpretovatelnost.

Následně v DGM (Darwin Gödel Machine) tým zavedl koncept otevřeného průzkumu z evolučních algoritmů, udržoval archiv návrhů a povzbuzoval model k prozkoumávání nových řešení.

ALMA dědí paradigmatu generování kódu ADAS a evoluční strategii DGM a zaměřuje aplikační scénáře na komponentu Agent systému, která nejvíce závisí na lidských zkušenostech – paměť.
Jak ALMA funguje
Mechanismus fungování ALMA je standardní meta-learningový uzavřený cyklus. Meta Agent již přímo nezpracovává úkoly, ale je zodpovědný za programování. Proces zahrnuje čtyři fáze:
- Koncept: Analyzujte aktuální archiv návrhů paměti a na základě historických výsledků navrhněte vylepšení
- Plánování: Převeďte koncept do logiky pseudokódu
- Implementace: Napište spustitelný Python kód a definujte základní funkce
- Hodnocení: Nasaďte vygenerovaný kód do sandboxového prostředí pro provedení úkolu a vraťte metriky výkonu

V procesu evoluce ALMA vygeneruje obrovský návrhový strom. S rostoucím počtem iterací se generovaný paměťový kód postupně vyvíjí od jednoduché logiky ukládání až po složitou kognitivní architekturu.

Vyvinuté paměťové struktury
Návrhy paměti generované ALMA vykazují v různých úlohách velké rozdíly:
- MiniHack (dobrodružství v kobkách): Navrhl modul Risk and Interaction, který explicitně zaznamenává operace, které vedou ke ztrátě krve, a agresivitu monster
- Baba Is AI (logické hádanky): Navrhl Strategy Library, která zaznamenává kombinace pravidel potřebné k překonání úrovní

To naznačuje, že AI dokáže rozpoznat vlastnosti úkolu: hry o přežití vyžadují pozornost rizikům a logické hádanky vyžadují pozornost abstrakci pravidel.
Výsledky experimentů
ALMA byla porovnána s hlavními základními liniemi ve čtyřech prostředích: TextWorld, ALFWorld, MiniHack, Baba Is AI.
Na modelu GPT-5-mini dosáhla ALMA průměrné úspěšnosti 53,9 %, což je lepší než G-Memory (46,0 %) a Trajectory Retrieval (48,6 %).

Z hlediska nákladové efektivity spotřebuje ALMA v průměru pouze 1 319 tokenů, zatímco Trajectory Retrieval spotřebuje až 9 149 tokenů a G-Memory dosahuje 6 055 tokenů. ALMA dosahuje lepšího výkonu s náklady pouze asi 1/7 až 1/5.

Závěr
ALMA ukazuje možnost přechodu od Software 2.0 (Neural Networks) k Software 3.0 (AI-Generating Algorithms).
Při vývoji Agentů se návrh paměťových modulů dlouhodobě spoléhal na intuici inženýrů. ALMA prokázala, že prostřednictvím meta-learningu a generování kódu může AI automaticky objevovat optimální architekturu paměti podle konkrétního prostředí.
Odkazy na zdroje
- Článek: https://arxiv.org/pdf/2602.07755
- Kód: https://github.com/zksha/alma
- Domovská stránka projektu: https://yimingxiong.me/alma





