Bez parametru regulēšanas, tikai koda rakstīšana! Jeff Clune komandas jaunais darbs: Meta Agent automātiski attīsta atmiņas moduļus

Ceļā uz Software 3.0, AI sāk pats rakstīt Python kodu, lai attīstītu smadzenes.

ALMA

Agentu izstrādes dziļajos ūdeņos atmiņa (Memory) vienmēr ir sāpīgs punkts, no kura nevar izvairīties.

Lai gan pamata modeļu spējas kļūst arvien spēcīgākas,推理procesā tās būtībā ir bezstāvokļa (Stateless), kas ierobežo Agentu spēju nepārtraukti uzkrāt pieredzi.

Pašlaik nozares galvenie atmiņas apstrādes risinājumi, neatkarīgi no tā, vai tie ir RAG vai slīdošā loga kopsavilkumi, būtībā joprojām atrodas cilvēku izstrādātu heiristisku noteikumu stadijā.

Šis manuāli izveidotais atmiņas modulis ir ārkārtīgi trausls un grūti pārnesams. Dialogu sistēmām rūpīgi noregulētie Prompt un meklēšanas loģika bieži vien tieši zaudē spēku, ja tos ievieto tālsatiksmes plānošanas uzdevumos (piemēram, ALFWorld) vai sarežģītās stratēģijas spēlēs.

ALMA arhitektūra

Lai atrisinātu šo problēmu, UBC profesors un bijušais OpenAI pētnieks Jeff Clune komanda piedāvāja ģeniālu risinājumu.

Tā kā nav zināms, kāda atmiņas struktūra ir vislabākā, ļaujiet Agentam pašam rakstīt Python kodu, lai to izstrādātu.

Tas ir tikko izlaistais ALMA (Automated meta-Learning of Memory designs for Agentic systems).

No ADAS līdz ALMA: uz kodu balstīta automatizēta projektēšana

ALMA ir šīs komandas nesen popularizētā AI ģenerēšanas algoritmu tehnoloģiju virziena turpinājums.

ADAS

ADAS (Automated Design of Agentic Systems) komanda pierādīja, ka, izstrādājot Agentu arhitektūru, kods ir efektīvāka meklēšanas telpa nekā neironu tīkla svars vai Soft Prompts. Kods ir Turing pilnīgs un tam ir ārkārtīgi augsta skaidrojuma pakāpe.

Meta Agent

Vēlāk DGM (Darwin Gödel Machine) komanda ieviesa atvērtās izpētes koncepciju no evolūcijas algoritmiem, uzturot dizaina arhīvu, lai mudinātu modeli izpētīt jaunus risinājumus.

DGM

ALMA manto ADAS koda ģenerēšanas paradigmu un DGM evolūcijas stratēģiju, koncentrējot lietojuma scenārijus uz Agentu sistēmu komponentu, kas visvairāk atkarīga no cilvēku pieredzes - atmiņu.

ALMA darbības mehānisms

ALMA darbības mehānisms ir standarta meta-mācīšanās slēgta cilpa. Meta Agent vairs tieši neapstrādā uzdevumus, bet ir atbildīgs par programmēšanu. Process ietver četras fāzes:

Idejas ģenerēšana: analizējiet pašreizējo atmiņas dizaina arhīvu un ģenerējiet uzlabojumu plānus, pamatojoties uz vēsturisko sniegumu
Plānošana: pārvērtiet idejas pseidokoda loģikā
Īstenošana: rakstiet izpildāmu Python kodu, definējiet galvenās funkcijas
Novērtēšana: izvietojiet ģenerēto kodu smilšu kastē, lai izpildītu uzdevumus, un atgrieziet veiktspējas rādītājus

Darba plūsma

Evolūcijas procesā ALMA ģenerēs milzīgu dizaina koku. Palielinoties iterāciju skaitam, ģenerētais atmiņas kods pakāpeniski attīstās no vienkāršas krātuves loģikas līdz sarežģītai kognitīvai arhitektūrai.

Evolūcijas koks

Attīstītās atmiņas struktūras

ALMA ģenerētie atmiņas dizaini dažādos uzdevumos uzrādīja ārkārtīgas atšķirības:

MiniHack (dungeon exploration): izstrādāja Risk and Interaction moduli, kas skaidri reģistrē darbības, kas izraisa asins zudumu, un monstru agresivitāti
Baba Is AI (loģikas mīklu risināšana): izstrādāja Strategy Library, kas reģistrē noteikumu kombinācijas, kas nepieciešamas, lai izietu līmeni

Atmiņas struktūra

Tas norāda, ka AI var identificēt uzdevuma īpašības: izdzīvošanas spēlēm jākoncentrējas uz risku, un mīklu spēlēm jākoncentrējas uz noteikumu abstrakciju.

Eksperimentu rezultāti

ALMA tika salīdzināta ar galvenajām bāzes līnijām četros vidēs: TextWorld, ALFWorld, MiniHack, Baba Is AI.

GPT-5-mini modelī ALMA vidējais panākumu līmenis sasniedza 53.9%, kas ir labāks nekā G-Memory (46.0%) un Trajectory Retrieval (48.6%).

Eksperimentu rezultāti

Attiecībā uz izmaksu efektivitāti ALMA vidēji patērē tikai 1,319 tokens, savukārt Trajectory Retrieval patērē līdz pat 9,149 tokens, un G-Memory sasniedza 6,055 tokens. ALMA ieguva labāku veiktspēju ar tikai aptuveni 1/7 līdz 1/5 no izmaksām.

Izmaksu efektivitāte

Secinājums

ALMA parāda iespēju pāriet no Software 2.0 (Neironu tīkli) uz Software 3.0 (AI ģenerēšanas algoritmi).

Agentu izstrādē atmiņas moduļu dizains ilgu laiku ir bijis atkarīgs no inženieru intuīcijas. ALMA pierādīja, ka, izmantojot meta-mācīšanos un koda ģenerēšanu, AI var automātiski atrast optimālo atmiņas arhitektūru atkarībā no konkrētās vides.

Resursu saites

Raksts: https://arxiv.org/pdf/2602.07755
Kods: https://github.com/zksha/alma
Projekta mājaslapa: https://yimingxiong.me/alma

Bez parametru regulēšanas, tikai koda rakstīšana! Jeff Clune komandas jaunais darbs: Meta Agent automātiski attīsta atmiņas moduļus

Bez parametru regulēšanas, tikai koda rakstīšana! Jeff Clune komandas jaunais darbs: Meta Agent automātiski attīsta atmiņas moduļus

No ADAS līdz ALMA: uz kodu balstīta automatizēta projektēšana

ALMA darbības mehānisms

Attīstītās atmiņas struktūras

Eksperimentu rezultāti

Secinājums

Resursu saites

You Might Also Like

Claude Code Buddy modificēšanas ceļvedis: kā iegūt spīdīgu leģendāro mājdzīvnieku

Obsidian ir izlaidusi Defuddle, pacelot Obsidian Web Clipper uz jauniem augstumiem

OpenAI pēkšņi paziņo par "trīs vienā": pārlūks + programmēšana + ChatGPT apvienošana, iekšēji atzīst, ka pagājušajā gadā tika pieļautas kļūdas

2026, vairs neuzspied sevi "pašdisciplīnai"! Veic šos 8 sīkumus, veselība nāks dabiski

Māmiņas, kas cenšas zaudēt svaru, bet nesasniedz rezultātus, noteikti ir šeit

AI Pārlūka 24 stundu stabilas darbības ceļvedis