Обзор RAG и Agent&LLM памяти на 107 страницах

Сегодня я поделюсь 107-страничным техническим обзором «Память в эпоху AI агентов: Обзор форм, функций и динамики» от Жэньминьского университета Китая, Фуданьского университета, Пекинского университета и других.

Адрес проекта: https://github.com/Shichun-Liu/Agent-Memory-Paper-List

Адрес статьи: https://arxiv.org/pdf/2512.13564

За последние два года мы стали свидетелями поразительной эволюции больших языковых моделей (LLM) в AI агентов (AI Agents). От Deep Research до разработки программного обеспечения, от научных открытий до многоагентного сотрудничества, эти агенты, основанные на базовых моделях, расширяют границы искусственного общего интеллекта (AGI).

Но возникает ключевой вопрос: как сделать так, чтобы агенты могли непрерывно учиться и адаптироваться, если статические параметры LLM не могут быть быстро обновлены?

Ответ — память (Memory).

"Память — это ключевая способность, которая превращает статические LLM в агентов, способных непрерывно адаптироваться посредством взаимодействия с окружающей средой."

Рисунок 1 демонстрирует единую структуру классификации, предложенную в статье, которая организует память агентов по трем измерениям: формы (Forms), функции (Functions), динамика (Dynamics), и сопоставляет репрезентативные системы с этой системой классификации.

В статье также четко разграничиваются Agent Memory и несколько тесно связанных, но существенно различных концепций: LLM память, генерация, дополненная поиском (RAG) и контекстная инженерия. Хотя все они связаны с хранением и использованием информации, существуют ключевые различия в целях, механизмах и сценариях применения.

Технологии памяти агентов

Self-Evolving Memory: Memento, H2R
Multimodal Memory: Ella, ViloMem, M3-Agent
Latent Memory: MemoryLLM, M+, MemGen
Parametric Memory: Retroformer, Early experience
RL-enabled Memory: MemAgent, RMM, MemSearcher, MEM1, Mem-alpha, Memory-R1

Память агентов vs. RAG

Технологии, связанные с RAG:

Modular RAG: FlashRAG, ComposeRAG
Graph RAG: LightRAG, HippoRAG
Agentic RAG: PlanRAG, Self-RAG

RAG и память агентов включают извлечение информации из внешнего хранилища для расширения возможностей модели, но между ними существуют существенные различия в философии проектирования:

Характеристика	RAG	Память агентов
Основная цель	Предоставление релевантной справочной информации для текущего запроса	Непрерывное обучение и адаптивное поведение во времени
Источник информации	Обычно статические, предварительно созданные базы знаний	Динамически генерируемая, персонализированная информация из собственного опыта взаимодействия агента
Триггер поиска	Пассивно запускается запросом пользователя	Активно решается агентом, когда и что искать
Обновление информации	База знаний обычно обновляется в автономном режиме	Обновляется онлайн, непрерывно и выборочно
Цикл обратной связи	Нет прямого механизма обратной связи	Формирует замкнутый цикл с взаимодействием с окружающей средой

Ключевое различие: RAG — это инструмент расширения знаний, а память агентов — это механизм обучения. RAG отвечает на вопрос «Что я знаю?», а память агентов отвечает на вопрос «Что я узнал?».

Память агентов vs. LLM память

Технологии, связанные с LLM памятью:

Attention KV management: Mixture-of-Memory
Long context processing: Mamba, Memformer, MoA, Sparseformer, NSA

Измерение	LLM память	Память агентов
Определение	Знания, интернализованные в параметрах модели, или временная информация в контекстном окне	Внешняя система, поддерживающая непрерывное взаимодействие агента с окружающей средой, обучение между задачами и долгосрочную адаптацию
Временной масштаб	Ограничен данными предварительного обучения или текущим контекстом диалога	Охватывает несколько задач, сеансов, поддерживает обучение на протяжении всей жизни
Возможность обновления	Обновление параметров дорогостоящее, контекстная информация легко теряется	Поддерживает эффективное, выборочное динамическое обновление и эволюцию
Активность	Пассивно отвечает на запросы	Активно решает, какую информацию хранить, обновлять и извлекать
Связь с окружающей средой	Нет прямого взаимодействия с окружающей средой	Глубоко интегрирована с обратной связью от окружающей среды, поддерживает интерактивное обучение

Ключевое различие: LLM память по сути статична (параметры фиксированы) или недолговечна (контекст ограничен), а память агентов динамична, постоянна и связана с окружающей средой.

Память агентов vs. Контекстная инженерия

Технологии, связанные с контекстной инженерией:

Tool-integrated reasoning: ReTool, ToolLLM, Toolformer, VTool-R1, ToRL
Tool selection: AutoTool, VisTA
Communication protocol: ANP, A2A, MCP, Agora

Аспект	Контекстная инженерия	Память агентов
Внимание	Оптимизация ввода для одного раунда или текущей задачи	Постоянство и использование информации в нескольких раундах и задачах
Временное измерение	Текущий сеанс	Длительная история
Выбор информации	Искусственный дизайн или эвристические правила	Автоматизированные механизмы формирования, эволюции и извлечения
Управление состоянием	Нет постоянного состояния	Явно поддерживает эволюционирующее состояние памяти

Ключевое различие: Контекстная инженерия — это техника оптимизации подсказок, а память агентов — это система управления состоянием. Первая фокусируется на «Что вводить сейчас», а вторая — на «Что запомнилось в прошлом и как это влияет на настоящее и будущее».

Обзор RAG и Agent&LLM памяти на 107 страницах

Технологии памяти агентов

Память агентов vs. RAG

Память агентов vs. LLM память

Память агентов vs. Контекстная инженерия

You Might Also Like

Claude Code Buddy 修改指南：如何获得闪光传说级宠物

Obsidian выпустил Defuddle, подняв Obsidian Web Clipper на новый уровень

OpenAI внезапно объявила о "тройном объединении": браузер + программирование + ChatGPT, внутреннее признание ошибок прошлого года

2026, больше не заставляйте себя "дисциплинироваться"! Сделайте эти 8 простых вещей, и здоровье придет само собой

Тем мамам, которые стараются похудеть, но не могут, определенно стоит задуматься здесь

AI Browser 24小时稳定运行指南