Без настройки параметров, только написание кода! Новая работа команды Джеффа Клуна: Meta Agent автоматически развивает модули памяти

2/14/2026
4 min read

Без настройки параметров, только написание кода! Новая работа команды Джеффа Клуна: Meta Agent автоматически развивает модули памяти

На пути к Software 3.0, ИИ начинает сам писать Python код для эволюции мозга.

ALMA

В глубоких водах разработки Agent, память (Memory) всегда является неизбежной проблемой.

Несмотря на растущую мощь базовых моделей, в процессе рассуждений они по сути являются безсостоятельными (Stateless), что ограничивает способность Agent непрерывно накапливать опыт.

В настоящее время основные решения для обработки памяти в отрасли, будь то RAG или скользящее окно аннотаций, по сути, все еще остаются на стадии эвристических правил, разработанных вручную.

Этот самодельный модуль памяти чрезвычайно хрупок и трудно переносится. Prompt и логика поиска, тщательно настроенные для диалоговых систем, часто выходят из строя при помещении в задачи долгосрочного планирования (например, ALFWorld) или сложные стратегические игры.

ALMA架构

Чтобы решить эту проблему, профессор UBC и бывший исследователь OpenAI Джефф Клун и его команда предложили гиковский подход.

Раз мы не знаем, какая структура памяти лучше, пусть Agent сам напишет Python код для ее разработки.

Это только что выпущенная ALMA (Automated meta-Learning of Memory designs for Agentic systems).

От ADAS к ALMA: Автоматизированный дизайн на основе кода

ALMA является продолжением технического маршрута алгоритмов генерации ИИ, который команда продвигает в последнее время.

ADAS

В ADAS (Automated Design of Agentic Systems) команда доказала, что при проектировании архитектуры Agent код является более эффективным пространством поиска, чем веса нейронной сети или Soft Prompts. Код обладает полнотой по Тьюрингу и обладает чрезвычайно высокой степенью интерпретируемости.

Meta Agent

Затем в DGM (Darwin Gödel Machine) команда представила концепцию открытого исследования из эволюционных алгоритмов, поддерживая архив проектов, поощряя модель к исследованию новых решений.

DGM

ALMA унаследовала парадигму генерации кода ADAS и эволюционную стратегию DGM, сосредоточив сценарии применения на компоненте Agent системы, наиболее зависящем от человеческого опыта — памяти.

Механизм работы ALMA

Механизм работы ALMA представляет собой стандартный цикл мета-обучения. Meta Agent больше не обрабатывает задачи напрямую, а отвечает за программирование. Процесс включает в себя четыре этапа:

  • Концептуализация: Анализ текущего архива проектов памяти, разработка планов улучшений на основе исторических показателей.
  • Планирование: Преобразование концепций в логику псевдокода.
  • Реализация: Написание исполняемого Python кода, определение основных функций.
  • Оценка: Развертывание сгенерированного кода в изолированной среде для выполнения задач, обратная связь по показателям производительности.

工作流程

В процессе эволюции ALMA генерирует огромное дерево проектов. С увеличением количества итераций сгенерированный код памяти постепенно эволюционирует от простой логики хранения к сложной когнитивной архитектуре.

进化树

Эволюционировавшая структура памяти

Сгенерированные ALMA проекты памяти демонстрируют огромные различия в разных задачах:

  • MiniHack (исследование подземелий): Разработан модуль Risk and Interaction, который явно записывает операции, приводящие к потере крови, и агрессивность монстров.
  • Baba Is AI (логическая головоломка): Разработана Strategy Library, которая записывает комбинации правил, необходимые для прохождения уровней.

记忆结构

Это показывает, что ИИ может распознавать характеристики задач: игры на выживание требуют внимания к рискам, а игры-головоломки требуют внимания к абстракции правил.

Результаты экспериментов

ALMA сравнивалась с основными базовыми показателями в четырех средах: TextWorld, ALFWorld, MiniHack, Baba Is AI.

На модели GPT-5-mini средний уровень успеха ALMA достиг 53,9%, что лучше, чем у G-Memory (46,0%) и Trajectory Retrieval (48,6%).

实验结果

С точки зрения экономической эффективности, ALMA в среднем потребляет всего 1319 токенов, в то время как Trajectory Retrieval потребляет до 9149 токенов, а G-Memory также достигает 6055 токенов. ALMA добилась лучшей производительности, затратив всего около 1/7–1/5 затрат.

成本效率

Заключение

ALMA демонстрирует возможность перехода от Software 2.0 (Neural Networks) к Software 3.0 (AI-Generating Algorithms).

При разработке Agent дизайн модуля памяти долгое время зависел от интуиции инженеров. ALMA доказала, что с помощью мета-обучения и генерации кода ИИ может автоматически находить оптимальную архитектуру памяти в зависимости от конкретной среды.

Ссылки на ресурсы

Published in Technology

You Might Also Like

Как использовать технологии облачных вычислений: Полное руководство по созданию вашей первой облачной инфраструктурыTechnology

Как использовать технологии облачных вычислений: Полное руководство по созданию вашей первой облачной инфраструктуры

Как использовать технологии облачных вычислений: Полное руководство по созданию вашей первой облачной инфраструктуры Вве...

Предупреждение! Отец Claude Code прямо говорит: через месяц без режима планирования титул программиста исчезнетTechnology

Предупреждение! Отец Claude Code прямо говорит: через месяц без режима планирования титул программиста исчезнет

Предупреждение! Отец Claude Code прямо говорит: через месяц без режима планирования титул программиста исчезнет Недавно...

2026年 Top 10 深度学习资源推荐Technology

2026年 Top 10 深度学习资源推荐

2026年 Top 10 深度学习资源推荐 随着深度学习在各个领域的迅速发展,越来越多的学习资源和工具涌现出来。本文将为您推荐2026年最值得关注的十个深度学习资源,帮助您在这一领域中快速成长。 1. Coursera Deep Learn...

Топ 10 AI агентов 2026 года: анализ ключевых преимуществTechnology

Топ 10 AI агентов 2026 года: анализ ключевых преимуществ

Топ 10 AI агентов 2026 года: анализ ключевых преимуществ Введение С быстрым развитием искусственного интеллекта AI агент...

Рекомендации по 10 лучшим инструментам ИИ на 2026 год: раскрытие истинного потенциала искусственного интеллектаTechnology

Рекомендации по 10 лучшим инструментам ИИ на 2026 год: раскрытие истинного потенциала искусственного интеллекта

Рекомендации по 10 лучшим инструментам ИИ на 2026 год: раскрытие истинного потенциала искусственного интеллекта В эпоху ...

Топ 10 инструментов и ресурсов AWS на 2026 годTechnology

Топ 10 инструментов и ресурсов AWS на 2026 год

Топ 10 инструментов и ресурсов AWS на 2026 год В быстро развивающейся области облачных вычислений Amazon Web Services (A...