Brez uglaševanja parametrov, samo pisanje kode! Nova stvaritev ekipe Jeffa Cluna: Meta Agent samodejno razvija spominske module

2/14/2026
4 min read

Brez uglaševanja parametrov, samo pisanje kode! Nova stvaritev ekipe Jeffa Cluna: Meta Agent samodejno razvija spominske module

Na poti do Software 3.0, AI začne pisati Python kodo za evolucijo možganov.

ALMA

Na globokem področju razvoja Agentov je spomin (Memory) vedno boleča točka, ki se ji ni mogoče izogniti.

Čeprav so zmožnosti osnovnih modelov vse močnejše, so v bistvu brez stanja (Stateless) med sklepanjem, kar omejuje sposobnost Agenta, da nenehno nabira izkušnje.

Trenutne prevladujoče rešitve za obdelavo spomina v industriji, ne glede na to, ali gre za RAG ali povzemanje drsnega okna, v bistvu še vedno ostajajo na stopnji ročno zasnovanih hevrističnih pravil.

Takšen ročno izdelan spominski modul je izjemno krhek in ga je težko prenesti. Skrbno uglašeni Prompti in logika iskanja za dialogne sisteme pogosto odpovejo, ko jih postavimo v dolgoročne načrtovalne naloge (kot je ALFWorld) ali kompleksne strateške igre.

ALMA arhitektura

Za to težavo je ekipa profesorja UBC in nekdanjega raziskovalca OpenAI Jeffa Cluna ponudila geekovsko rešitev.

Ker ne vemo, kakšna spominska struktura je najboljša, naj Agent sam napiše Python kodo za njeno zasnovo.

To je pravkar objavljeni ALMA (Automated meta-Learning of Memory designs for Agentic systems).

Od ADAS do ALMA: Avtomatizirana zasnova na podlagi kode

ALMA je nadaljevanje tehnične poti algoritmov za generiranje AI, ki jo je ekipa nedavno zagovarjala.

ADAS

V ADAS (Automated Design of Agentic Systems) je ekipa dokazala, da je koda učinkovitejši iskalni prostor kot nevronske mreže ali Soft Prompts pri načrtovanju arhitekture Agenta. Koda ima Turingovo popolnost in izjemno razložljivost.

Meta Agent

Kasneje je ekipa v DGM (Darwin Gödel Machine) uvedla koncept odprtega raziskovanja iz evolucijskih algoritmov, vzdrževala arhiv zasnov in spodbujala model, da raziskuje nove rešitve.

DGM

ALMA podeduje paradigmo generiranja kode ADAS in evolucijsko strategijo DGM, pri čemer se osredotoča na komponento, ki je najbolj odvisna od človeških izkušenj v sistemu Agentov - spomin.

Mehanizem delovanja ALMA

Mehanizem delovanja ALMA je standardna meta-učna zanka. Meta Agent ne obravnava več neposredno nalog, temveč je odgovoren za programiranje. Postopek vključuje štiri faze:

  • Zasnova: Analizirajte trenutni arhiv spominskih zasnov in na podlagi preteklih rezultatov oblikujte načrte za izboljšave
  • Načrtovanje: Pretvorite zasnovo v psevdokodno logiko
  • Izvedba: Napišite izvedljivo Python kodo, ki definira temeljne funkcije
  • Ocena: Razmestite generirano kodo v peskovniško okolje za izvajanje nalog in posredujte kazalnike uspešnosti

Delovni proces

V procesu evolucije bo ALMA ustvaril obsežno drevo zasnov. Z naraščanjem števila iteracij se generirana spominska koda postopoma razvija iz preproste logike shranjevanja v kompleksno kognitivno arhitekturo.

Evolucijsko drevo

Evolvirane spominske strukture

Spominske zasnove, ki jih je ustvaril ALMA, so pokazale izjemne razlike v različnih nalogah:

  • MiniHack (raziskovanje ječe): Zasnoval je modul Risk and Interaction, ki izrecno beleži operacije, ki povzročajo izgubo zdravja, in agresivnost pošasti
  • Baba Is AI (logična uganka): Zasnoval je Strategy Library, ki beleži kombinacije pravil, potrebnih za prehod skozi raven

Spominska struktura

To kaže, da lahko AI prepozna značilnosti naloge: igre preživetja morajo biti pozorne na tveganja, igre uganke pa se morajo osredotočiti na abstrakcijo pravil.

Rezultati poskusov

ALMA je bil primerjan z glavnimi osnovnimi linijami v štirih okoljih: TextWorld, ALFWorld, MiniHack, Baba Is AI.

Na modelu GPT-5-mini je povprečna stopnja uspešnosti ALMA dosegla 53,9 %, kar je bolje od G-Memory (46,0 %) in Trajectory Retrieval (48,6 %).

Rezultati poskusov

V smislu stroškovne učinkovitosti ALMA v povprečju porabi le 1.319 žetonov (tokens), medtem ko Trajectory Retrieval porabi kar 9.149 žetonov, G-Memory pa doseže 6.055 žetonov. ALMA je dosegel boljšo zmogljivost s samo približno 1/7 do 1/5 stroškov.

Stroškovna učinkovitost

Zaključek

ALMA prikazuje možnost prehoda iz Software 2.0 (Neural Networks) v Software 3.0 (AI-Generating Algorithms).

Pri razvoju Agenta je bila zasnova spominskih modulov dolgo odvisna od intuicije inženirjev. ALMA je dokazal, da lahko AI z meta-učenjem in generiranjem kode samodejno odkrije optimalno spominsko arhitekturo glede na specifično okolje.

Povezave do virov

Published in Technology

You Might Also Like