Bez ladění parametrů, jen psaní kódu! Nová práce týmu Jeffa Clunea: Meta Agent automaticky vyvíjí paměťové moduly

Cesta k Software 3.0, AI začíná sama psát Python kód a vyvíjet mozek.

ALMA

V hlubokých vodách vývoje Agentů je paměť (Memory) vždy bolestivým bodem, kterému se nelze vyhnout.

I když jsou schopnosti základních modelů stále silnější, v procesu odvozování jsou v podstatě bezstavové (Stateless), což omezuje schopnost Agenta neustále akumulovat zkušenosti.

Současné hlavní řešení pro zpracování paměti v průmyslu, ať už RAG nebo shrnutí posuvného okna, v podstatě stále zůstávají ve fázi heuristických pravidel navržených lidmi.

Tento ručně vytvořený paměťový modul je extrémně křehký a obtížně přenositelný. Pečlivě vyladěné Prompty a vyhledávací logika pro dialogové systémy často selžou, jakmile jsou umístěny do úloh dlouhodobého plánování (jako je ALFWorld) nebo složitých strategických her.

ALMA architektura

S ohledem na tuto obtížnou situaci tým profesora UBC a bývalého výzkumníka OpenAI Jeffa Clunea přišel s geekovským řešením.

Protože nevíme, jaká paměťová struktura je nejlepší, nechme Agenta, ať si sám napíše Python kód pro její návrh.

To je právě vydaný ALMA (Automated meta-Learning of Memory designs for Agentic systems).

Od ADAS k ALMA: Automatizovaný návrh založený na kódu

ALMA je pokračováním technologické cesty algoritmů generovaných AI, kterou tento tým nedávno prosazoval.

ADAS

V ADAS (Automated Design of Agentic Systems) tým prokázal, že při navrhování architektury Agenta je kód efektivnější vyhledávací prostor než váhy neuronové sítě nebo Soft Prompts. Kód má Turingovu úplnost a silnou interpretovatelnost.

Meta Agent

Následně v DGM (Darwin Gödel Machine) tým zavedl koncept otevřeného průzkumu z evolučních algoritmů, udržoval archiv návrhů a povzbuzoval model k prozkoumávání nových řešení.

DGM

ALMA dědí paradigmatu generování kódu ADAS a evoluční strategii DGM a zaměřuje aplikační scénáře na komponentu Agent systému, která nejvíce závisí na lidských zkušenostech – paměť.

Jak ALMA funguje

Mechanismus fungování ALMA je standardní meta-learningový uzavřený cyklus. Meta Agent již přímo nezpracovává úkoly, ale je zodpovědný za programování. Proces zahrnuje čtyři fáze:

Koncept: Analyzujte aktuální archiv návrhů paměti a na základě historických výsledků navrhněte vylepšení
Plánování: Převeďte koncept do logiky pseudokódu
Implementace: Napište spustitelný Python kód a definujte základní funkce
Hodnocení: Nasaďte vygenerovaný kód do sandboxového prostředí pro provedení úkolu a vraťte metriky výkonu

Pracovní postup

V procesu evoluce ALMA vygeneruje obrovský návrhový strom. S rostoucím počtem iterací se generovaný paměťový kód postupně vyvíjí od jednoduché logiky ukládání až po složitou kognitivní architekturu.

Evoluční strom

Vyvinuté paměťové struktury

Návrhy paměti generované ALMA vykazují v různých úlohách velké rozdíly:

MiniHack (dobrodružství v kobkách): Navrhl modul Risk and Interaction, který explicitně zaznamenává operace, které vedou ke ztrátě krve, a agresivitu monster
Baba Is AI (logické hádanky): Navrhl Strategy Library, která zaznamenává kombinace pravidel potřebné k překonání úrovní

Paměťová struktura

To naznačuje, že AI dokáže rozpoznat vlastnosti úkolu: hry o přežití vyžadují pozornost rizikům a logické hádanky vyžadují pozornost abstrakci pravidel.

Výsledky experimentů

ALMA byla porovnána s hlavními základními liniemi ve čtyřech prostředích: TextWorld, ALFWorld, MiniHack, Baba Is AI.

Na modelu GPT-5-mini dosáhla ALMA průměrné úspěšnosti 53,9 %, což je lepší než G-Memory (46,0 %) a Trajectory Retrieval (48,6 %).

Výsledky experimentů

Z hlediska nákladové efektivity spotřebuje ALMA v průměru pouze 1 319 tokenů, zatímco Trajectory Retrieval spotřebuje až 9 149 tokenů a G-Memory dosahuje 6 055 tokenů. ALMA dosahuje lepšího výkonu s náklady pouze asi 1/7 až 1/5.

Nákladová efektivita

Závěr

ALMA ukazuje možnost přechodu od Software 2.0 (Neural Networks) k Software 3.0 (AI-Generating Algorithms).

Při vývoji Agentů se návrh paměťových modulů dlouhodobě spoléhal na intuici inženýrů. ALMA prokázala, že prostřednictvím meta-learningu a generování kódu může AI automaticky objevovat optimální architekturu paměti podle konkrétního prostředí.

Odkazy na zdroje

Článek: https://arxiv.org/pdf/2602.07755
Kód: https://github.com/zksha/alma
Domovská stránka projektu: https://yimingxiong.me/alma

Bez ladění parametrů, jen psaní kódu! Nová práce týmu Jeffa Clunea: Meta Agent automaticky vyvíjí paměťové moduly

Bez ladění parametrů, jen psaní kódu! Nová práce týmu Jeffa Clunea: Meta Agent automaticky vyvíjí paměťové moduly

Od ADAS k ALMA: Automatizovaný návrh založený na kódu

Jak ALMA funguje

Vyvinuté paměťové struktury

Výsledky experimentů

Závěr

Odkazy na zdroje

You Might Also Like

Claude Code Buddy úpravy: Jak získat lesklého legendárního mazlíčka

Obsidian uvedl Defuddle, který posunul Obsidian Web Clipper na novou úroveň

OpenAI náhle oznámila "třív jednom": sloučení prohlížeče + programování + ChatGPT, interně přiznává, že se v uplynulém roce mýlila

2026, už se nenuťte k "sebeovládání"! Udělejte těchto 8 drobností a zdraví přijde přirozeně

Ty matky, které se snaží zhubnout, ale nedaří se jim, se určitě potýkají s tímto problémem

AI Browser 24 hodinový stabilní provozní průvodce