Без настройки параметров, только написание кода! Новая работа команды Джеффа Клуна: Meta Agent автоматически развивает модули памяти

На пути к Software 3.0, ИИ начинает сам писать Python код для эволюции мозга.

ALMA

В глубоких водах разработки Agent, память (Memory) всегда является неизбежной проблемой.

Несмотря на растущую мощь базовых моделей, в процессе рассуждений они по сути являются безсостоятельными (Stateless), что ограничивает способность Agent непрерывно накапливать опыт.

В настоящее время основные решения для обработки памяти в отрасли, будь то RAG или скользящее окно аннотаций, по сути, все еще остаются на стадии эвристических правил, разработанных вручную.

Этот самодельный модуль памяти чрезвычайно хрупок и трудно переносится. Prompt и логика поиска, тщательно настроенные для диалоговых систем, часто выходят из строя при помещении в задачи долгосрочного планирования (например, ALFWorld) или сложные стратегические игры.

ALMA架构

Чтобы решить эту проблему, профессор UBC и бывший исследователь OpenAI Джефф Клун и его команда предложили гиковский подход.

Раз мы не знаем, какая структура памяти лучше, пусть Agent сам напишет Python код для ее разработки.

Это только что выпущенная ALMA (Automated meta-Learning of Memory designs for Agentic systems).

От ADAS к ALMA: Автоматизированный дизайн на основе кода

ALMA является продолжением технического маршрута алгоритмов генерации ИИ, который команда продвигает в последнее время.

ADAS

В ADAS (Automated Design of Agentic Systems) команда доказала, что при проектировании архитектуры Agent код является более эффективным пространством поиска, чем веса нейронной сети или Soft Prompts. Код обладает полнотой по Тьюрингу и обладает чрезвычайно высокой степенью интерпретируемости.

Meta Agent

Затем в DGM (Darwin Gödel Machine) команда представила концепцию открытого исследования из эволюционных алгоритмов, поддерживая архив проектов, поощряя модель к исследованию новых решений.

DGM

ALMA унаследовала парадигму генерации кода ADAS и эволюционную стратегию DGM, сосредоточив сценарии применения на компоненте Agent системы, наиболее зависящем от человеческого опыта — памяти.

Механизм работы ALMA

Механизм работы ALMA представляет собой стандартный цикл мета-обучения. Meta Agent больше не обрабатывает задачи напрямую, а отвечает за программирование. Процесс включает в себя четыре этапа:

Концептуализация: Анализ текущего архива проектов памяти, разработка планов улучшений на основе исторических показателей.
Планирование: Преобразование концепций в логику псевдокода.
Реализация: Написание исполняемого Python кода, определение основных функций.
Оценка: Развертывание сгенерированного кода в изолированной среде для выполнения задач, обратная связь по показателям производительности.

工作流程

В процессе эволюции ALMA генерирует огромное дерево проектов. С увеличением количества итераций сгенерированный код памяти постепенно эволюционирует от простой логики хранения к сложной когнитивной архитектуре.

进化树

Эволюционировавшая структура памяти

Сгенерированные ALMA проекты памяти демонстрируют огромные различия в разных задачах:

MiniHack (исследование подземелий): Разработан модуль Risk and Interaction, который явно записывает операции, приводящие к потере крови, и агрессивность монстров.
Baba Is AI (логическая головоломка): Разработана Strategy Library, которая записывает комбинации правил, необходимые для прохождения уровней.

记忆结构

Это показывает, что ИИ может распознавать характеристики задач: игры на выживание требуют внимания к рискам, а игры-головоломки требуют внимания к абстракции правил.

Результаты экспериментов

ALMA сравнивалась с основными базовыми показателями в четырех средах: TextWorld, ALFWorld, MiniHack, Baba Is AI.

На модели GPT-5-mini средний уровень успеха ALMA достиг 53,9%, что лучше, чем у G-Memory (46,0%) и Trajectory Retrieval (48,6%).

实验结果

С точки зрения экономической эффективности, ALMA в среднем потребляет всего 1319 токенов, в то время как Trajectory Retrieval потребляет до 9149 токенов, а G-Memory также достигает 6055 токенов. ALMA добилась лучшей производительности, затратив всего около 1/7–1/5 затрат.

成本效率

Заключение

ALMA демонстрирует возможность перехода от Software 2.0 (Neural Networks) к Software 3.0 (AI-Generating Algorithms).

При разработке Agent дизайн модуля памяти долгое время зависел от интуиции инженеров. ALMA доказала, что с помощью мета-обучения и генерации кода ИИ может автоматически находить оптимальную архитектуру памяти в зависимости от конкретной среды.

Ссылки на ресурсы

Статья: https://arxiv.org/pdf/2602.07755
Код: https://github.com/zksha/alma
Главная страница проекта: https://yimingxiong.me/alma

Без настройки параметров, только написание кода! Новая работа команды Джеффа Клуна: Meta Agent автоматически развивает модули памяти

Без настройки параметров, только написание кода! Новая работа команды Джеффа Клуна: Meta Agent автоматически развивает модули памяти

От ADAS к ALMA: Автоматизированный дизайн на основе кода

Механизм работы ALMA

Эволюционировавшая структура памяти

Результаты экспериментов

Заключение

Ссылки на ресурсы

You Might Also Like

Claude Code Buddy 修改指南：如何获得闪光传说级宠物

Obsidian выпустил Defuddle, подняв Obsidian Web Clipper на новый уровень

OpenAI внезапно объявила о "тройном объединении": браузер + программирование + ChatGPT, внутреннее признание ошибок прошлого года

2026, больше не заставляйте себя "дисциплинироваться"! Сделайте эти 8 простых вещей, и здоровье придет само собой

Тем мамам, которые стараются похудеть, но не могут, определенно стоит задуматься здесь

AI Browser 24小时稳定运行指南