Bez ladenia parametrov, len písanie kódu! Novinka tímu Jeffa Clunea: Meta Agent automaticky vyvíja pamäťové moduly
Bez ladenia parametrov, len písanie kódu! Novinka tímu Jeffa Clunea: Meta Agent automaticky vyvíja pamäťové moduly
Na ceste k Software 3.0, AI začína písať vlastný Python kód na evolúciu mozgu.

V hlbokých vodách vývoja Agentov je pamäť (Memory) vždy bolestivým bodom, ktorému sa nedá vyhnúť.
Napriek rastúcej sile základných modelov sú v procese odvodzovania v podstate bezstavové (Stateless), čo obmedzuje schopnosť Agenta neustále zbierať skúsenosti.
Súčasné hlavné riešenia pre spracovanie pamäte v priemysle, či už ide o RAG alebo zhrnutie posuvného okna, v podstate stále zostávajú v štádiu heuristických pravidiel navrhnutých človekom.
Tento ručne vytvorený pamäťový modul je mimoriadne krehký a ťažko prenositeľný. Prompt a logika vyhľadávania, ktoré sú starostlivo vyladené pre dialógové systémy, často zlyhajú, ak sú umiestnené do úloh dlhodobého plánovania (ako napríklad ALFWorld) alebo komplexných strategických hier.

Na túto dilemu tím profesora UBC a bývalého výskumníka OpenAI Jeffa Clunea ponúka geekovské riešenie.
Keďže nevieme, aká pamäťová štruktúra je najlepšia, nech Agent sám napíše Python kód na jej návrh.
To je práve vydaný ALMA (Automated meta-Learning of Memory designs for Agentic systems).
Od ADAS k ALMA: Automatizovaný dizajn založený na kóde
ALMA je pokračovaním technologického smeru AI generovaných algoritmov, ktorý tento tím nedávno presadzoval.

V ADAS (Automated Design of Agentic Systems) tím dokázal, že pri návrhu architektúry Agenta je kód efektívnejší priestor vyhľadávania ako váhy neurónovej siete alebo Soft Prompts. Kód má Turingovu úplnosť a mimoriadnu interpretovateľnosť.

Následne v DGM (Darwin Gödel Machine) tím zaviedol koncept otvoreného prieskumu z evolučných algoritmov, udržiavajúc archív návrhov, ktorý povzbudzuje model k skúmaniu nových riešení.

ALMA zdedila paradigmu generovania kódu ADAS a evolučnú stratégiu DGM, pričom sa zameriava na komponent pamäte, ktorý je v systémoch Agent najviac závislý od ľudských skúseností.
Mechanizmus fungovania ALMA
Mechanizmus fungovania ALMA je štandardný meta-learningový uzavretý cyklus. Meta Agent už priamo nespracováva úlohy, ale je zodpovedný za programovanie. Proces zahŕňa štyri fázy:
- Koncept: Analyzuje aktuálny archív pamäťových návrhov a na základe historických výkonov navrhuje vylepšenia
- Plánovanie: Transformuje koncept na pseudokódovú logiku
- Implementácia: Píše spustiteľný Python kód, definuje základné funkcie
- Hodnotenie: Nasadzuje vygenerovaný kód do sandboxového prostredia na vykonávanie úloh a poskytuje spätnú väzbu o metrikách výkonu

V procese evolúcie ALMA vygeneruje rozsiahly strom návrhov. S rastúcim počtom iterácií sa vygenerovaný pamäťový kód postupne vyvíja od jednoduchej logiky ukladania až po komplexné kognitívne architektúry.

Vyvinuté pamäťové štruktúry
Pamäťové návrhy generované ALMA vykazujú v rôznych úlohách obrovské rozdiely:
- MiniHack (dobrodružstvo v kobkách): Navrhnutý modul Risk and Interaction, ktorý explicitne zaznamenáva operácie, ktoré spôsobujú stratu zdravia, a agresivitu príšer
- Baba Is AI (logické hádanky): Navrhnutá Strategy Library, ktorá zaznamenáva kombinácie pravidiel potrebných na prejdenie úrovňami

To naznačuje, že AI je schopná rozpoznať charakteristiky úloh: hry o prežitie si vyžadujú pozornosť na riziká a hádanky si vyžadujú pozornosť na abstrakciu pravidiel.
Výsledky experimentov
ALMA bola porovnávaná s hlavnými základnými líniami v štyroch prostrediach: TextWorld, ALFWorld, MiniHack, Baba Is AI.
Na modeli GPT-5-mini dosiahla ALMA priemernú úspešnosť 53,9 %, čo je lepšie ako G-Memory (46,0 %) a Trajectory Retrieval (48,6 %).

Z hľadiska nákladovej efektívnosti spotrebuje ALMA v priemere iba 1 319 tokenov, zatiaľ čo Trajectory Retrieval spotrebuje až 9 149 tokenov a G-Memory dosahuje 6 055 tokenov. ALMA dosahuje lepší výkon s nákladmi približne 1/7 až 1/5.

Záver
ALMA demonštruje možnosť prechodu od Software 2.0 (Neurónové siete) k Software 3.0 (AI-Generujúce algoritmy).
Pri vývoji Agentov bol návrh pamäťových modulov dlhodobo závislý od intuície inžinierov. ALMA dokázala, že prostredníctvom meta-learningu a generovania kódu je AI schopná automaticky objaviť optimálnu pamäťovú architektúru v závislosti od konkrétneho prostredia.
Odkazy na zdroje
- Práca: https://arxiv.org/pdf/2602.07755
- Kód: https://github.com/zksha/alma
- Domovská stránka projektu: https://yimingxiong.me/alma





