Без настройки параметров, только написание кода! Новая работа команды Джеффа Клуна: Meta Agent автоматически развивает модули памяти

2/14/2026
4 min read

Без настройки параметров, только написание кода! Новая работа команды Джеффа Клуна: Meta Agent автоматически развивает модули памяти

На пути к Software 3.0, ИИ начинает сам писать Python код для эволюции мозга.

ALMA

В глубоких водах разработки Agent, память (Memory) всегда является неизбежной проблемой.

Несмотря на растущую мощь базовых моделей, в процессе рассуждений они по сути являются безсостоятельными (Stateless), что ограничивает способность Agent непрерывно накапливать опыт.

В настоящее время основные решения для обработки памяти в отрасли, будь то RAG или скользящее окно аннотаций, по сути, все еще остаются на стадии эвристических правил, разработанных вручную.

Этот самодельный модуль памяти чрезвычайно хрупок и трудно переносится. Prompt и логика поиска, тщательно настроенные для диалоговых систем, часто выходят из строя при помещении в задачи долгосрочного планирования (например, ALFWorld) или сложные стратегические игры.

ALMA架构

Чтобы решить эту проблему, профессор UBC и бывший исследователь OpenAI Джефф Клун и его команда предложили гиковский подход.

Раз мы не знаем, какая структура памяти лучше, пусть Agent сам напишет Python код для ее разработки.

Это только что выпущенная ALMA (Automated meta-Learning of Memory designs for Agentic systems).

От ADAS к ALMA: Автоматизированный дизайн на основе кода

ALMA является продолжением технического маршрута алгоритмов генерации ИИ, который команда продвигает в последнее время.

ADAS

В ADAS (Automated Design of Agentic Systems) команда доказала, что при проектировании архитектуры Agent код является более эффективным пространством поиска, чем веса нейронной сети или Soft Prompts. Код обладает полнотой по Тьюрингу и обладает чрезвычайно высокой степенью интерпретируемости.

Meta Agent

Затем в DGM (Darwin Gödel Machine) команда представила концепцию открытого исследования из эволюционных алгоритмов, поддерживая архив проектов, поощряя модель к исследованию новых решений.

DGM

ALMA унаследовала парадигму генерации кода ADAS и эволюционную стратегию DGM, сосредоточив сценарии применения на компоненте Agent системы, наиболее зависящем от человеческого опыта — памяти.

Механизм работы ALMA

Механизм работы ALMA представляет собой стандартный цикл мета-обучения. Meta Agent больше не обрабатывает задачи напрямую, а отвечает за программирование. Процесс включает в себя четыре этапа:

  • Концептуализация: Анализ текущего архива проектов памяти, разработка планов улучшений на основе исторических показателей.
  • Планирование: Преобразование концепций в логику псевдокода.
  • Реализация: Написание исполняемого Python кода, определение основных функций.
  • Оценка: Развертывание сгенерированного кода в изолированной среде для выполнения задач, обратная связь по показателям производительности.

工作流程

В процессе эволюции ALMA генерирует огромное дерево проектов. С увеличением количества итераций сгенерированный код памяти постепенно эволюционирует от простой логики хранения к сложной когнитивной архитектуре.

进化树

Эволюционировавшая структура памяти

Сгенерированные ALMA проекты памяти демонстрируют огромные различия в разных задачах:

  • MiniHack (исследование подземелий): Разработан модуль Risk and Interaction, который явно записывает операции, приводящие к потере крови, и агрессивность монстров.
  • Baba Is AI (логическая головоломка): Разработана Strategy Library, которая записывает комбинации правил, необходимые для прохождения уровней.

记忆结构

Это показывает, что ИИ может распознавать характеристики задач: игры на выживание требуют внимания к рискам, а игры-головоломки требуют внимания к абстракции правил.

Результаты экспериментов

ALMA сравнивалась с основными базовыми показателями в четырех средах: TextWorld, ALFWorld, MiniHack, Baba Is AI.

На модели GPT-5-mini средний уровень успеха ALMA достиг 53,9%, что лучше, чем у G-Memory (46,0%) и Trajectory Retrieval (48,6%).

实验结果

С точки зрения экономической эффективности, ALMA в среднем потребляет всего 1319 токенов, в то время как Trajectory Retrieval потребляет до 9149 токенов, а G-Memory также достигает 6055 токенов. ALMA добилась лучшей производительности, затратив всего около 1/7–1/5 затрат.

成本效率

Заключение

ALMA демонстрирует возможность перехода от Software 2.0 (Neural Networks) к Software 3.0 (AI-Generating Algorithms).

При разработке Agent дизайн модуля памяти долгое время зависел от интуиции инженеров. ALMA доказала, что с помощью мета-обучения и генерации кода ИИ может автоматически находить оптимальную архитектуру памяти в зависимости от конкретной среды.

Ссылки на ресурсы

Published in Technology

You Might Also Like

📝
Technology

Claude Code Buddy 修改指南:如何获得闪光传说级宠物

Claude Code Buddy 修改指南:如何获得闪光传说级宠物 2026年4月1日,Anthropic 在 Claude Code 2.1.89 版本中悄然上线了一个彩蛋功能——/buddy 宠物系统。在终端输入 /buddy 后,一...

Obsidian выпустил Defuddle, подняв Obsidian Web Clipper на новый уровеньTechnology

Obsidian выпустил Defuddle, подняв Obsidian Web Clipper на новый уровень

Obsidian выпустил Defuddle, подняв Obsidian Web Clipper на новый уровень Мне всегда нравилась основная идея Obsidian: п...

OpenAI внезапно объявила о "тройном объединении": браузер + программирование + ChatGPT, внутреннее признание ошибок прошлого годаTechnology

OpenAI внезапно объявила о "тройном объединении": браузер + программирование + ChatGPT, внутреннее признание ошибок прошлого года

OpenAI внезапно объявила о "тройном объединении": браузер + программирование + ChatGPT, внутреннее признание ошибок прош...

2026, больше не заставляйте себя "дисциплинироваться"! Сделайте эти 8 простых вещей, и здоровье придет само собойHealth

2026, больше не заставляйте себя "дисциплинироваться"! Сделайте эти 8 простых вещей, и здоровье придет само собой

2026, больше не заставляйте себя "дисциплинироваться"! Сделайте эти 8 простых вещей, и здоровье придет само собой Новый...

Тем мамам, которые стараются похудеть, но не могут, определенно стоит задуматься здесьHealth

Тем мамам, которые стараются похудеть, но не могут, определенно стоит задуматься здесь

Тем мамам, которые стараются похудеть, но не могут, определенно стоит задуматься здесь Март уже почти прошел, как у вас...

📝
Technology

AI Browser 24小时稳定运行指南

AI Browser 24小时稳定运行指南 Этот учебник описывает, как создать стабильную, долгосрочную среду для AI браузера. Подходит для A...