Преглед на 107 страници за RAG и Agent&LLM памет

Днес споделям технически преглед от 107 страници от Renmin University, Fudan University, Peking University и др., озаглавен „Memory in the Age of AI Agents: A Survey Forms, Functions and Dynamics“.

Адрес на проекта: https://github.com/Shichun-Liu/Agent-Memory-Paper-List

Адрес на статията: https://arxiv.org/pdf/2512.13564

През последните две години станахме свидетели на невероятната еволюция на големите езикови модели (LLM) в AI агенти (AI Agents). От Deep Research до софтуерно инженерство, от научни открития до сътрудничество между множество агенти, тези интелигентни агенти, базирани на основни модели, тласкат границите на общия изкуствен интелект (AGI).

Но се появява основен въпрос: Как да позволим на агентите да имат непрекъснато обучение и адаптивност, когато статичните LLM параметри не могат да бъдат актуализирани бързо?

Отговорът е – памет (Memory).

"Паметта е ключовата способност да се трансформират статичните LLM в интелигентни агенти, които могат непрекъснато да се адаптират чрез взаимодействие с околната среда."

Фигура 1 показва унифицираната рамка за класификация, предложена в статията, която организира паметта на агента според три измерения: форми (Forms), функции (Functions) и динамика (Dynamics), и картографира представителни системи в тази класификационна система.

Статията също така прави ясно разграничение между Agent Memory и няколко тясно свързани, но по същество различни концепции: LLM памет, извличане-разширена генерация (RAG) и контекстно инженерство. Въпреки че всички те са свързани със съхранението и използването на информация, има ключови разлики в целите, механизмите и сценариите на приложение.

Технологии за памет на агенти

Self-Evolving Memory: Memento, H2R
Multimodal Memory: Ella, ViloMem, M3-Agent
Latent Memory: MemoryLLM, M+, MemGen
Parametric Memory: Retroformer, Early experience
RL-enabled Memory: MemAgent, RMM, MemSearcher, MEM1, Mem-alpha, Memory-R1

Agent Memory vs. RAG

RAG свързани технологии:

Modular RAG: FlashRAG, ComposeRAG
Graph RAG: LightRAG, HippoRAG
Agentic RAG: PlanRAG, Self-RAG

RAG и паметта на агента включват извличане на информация от външно хранилище, за да се подобри способността на модела, но има съществена разлика във философията на дизайна между двете:

ХарактеристикаRAGПамет на агента Основна целОсигуряване на подходяща подкрепа за фонова информация за текущата заявкаНепрекъснато обучение и адаптивно поведение във времето Източник на информацияОбикновено статични, предварително изградени бази знанияДинамично генерирана, персонализирана информация от собствения опит на агента Задействане на извличанеПасивно задействано от потребителска заявкаАктивно решено от агента кога и какво да извлече Актуализация на информациятаБазите знания обикновено се актуализират офлайнОнлайн, непрекъснато и селективно актуализиране Обратна връзкаНяма механизъм за директна обратна връзкаЗатворен цикъл с взаимодействие с околната среда

Ключова разлика: RAG е инструмент за разширяване на знанията, докато паметта на агента е механизъм за обучение. RAG отговаря на въпроса „Какво знам“, а паметта на агента отговаря на въпроса „Какво научих“.

Agent Memory vs. LLM Memory

LLM свързани технологии за памет:

Attention KV management: Mixture-of-Memory
Long context processing: Mamba, Memformer, MoA, Sparseformer, NSA

ИзмерениеLLM паметПамет на агента ОпределениеИнтегрирани знания в параметрите на модела или временна информация в контекстния прозорецВъншна система, която поддържа непрекъснато взаимодействие на агента с околната среда, обучение между задачи и дългосрочна адаптация Времева скалаОграничена до предварително обучени данни или текущ контекст на разговорОбхваща множество задачи, сесии и поддържа учене през целия живот Възможност за актуализиранеРазходите за актуализиране на параметрите са високи, а контекстната информация е нестабилнаПоддържа ефективна, селективна динамична актуализация и еволюция ПроактивностПасивно отговаря на заявкиАктивно решава каква информация да съхранява, актуализира и извлича Свързаност с околната средаНяма директно взаимодействие с околната средаДълбоко интегрирана обратна връзка от околната среда, поддържа интерактивно обучение

Ключова разлика: LLM паметта е по същество статична (фиксирани параметри) или краткотрайна (ограничен контекст), докато паметта на агента е динамична, постоянна и свързана с околната среда.

Agent Memory vs. Контекстно инженерство

Контекстно инженерство свързани технологии:

Tool-integrated reasoning: ReTool, ToolLLM, Toolformer, VTool-R1, ToRL
Tool selection: AutoTool, VisTA
Communication protocol: ANP, A2A, MCP, Agora

АспектКонтекстно инженерствоПамет на агента ФокусОптимизация на входа за единичен или текущ проблемПерсистиране и използване на информация в множество кръгове и задачи Времево измерениеТекуща сесияДълга история Избор на информацияРъчно проектирани или евристични правилаАвтоматизиран механизъм за формиране, еволюция и извличане Управление на състояниетоНяма постоянно състояниеЯвно поддържа еволюиращо състояние на паметта

Ключова разлика: Контекстното инженерство е техника за оптимизация на подканите, а паметта на агента е система за управление на състоянието. Първото се фокусира върху „Какво да въведем сега“, а второто се фокусира върху „Какво е запомнено в миналото и как влияе на настоящето и бъдещето“.

Преглед на 107 страници за RAG и Agent&LLM памет

Технологии за памет на агенти

Agent Memory vs. RAG

Agent Memory vs. LLM Memory

Agent Memory vs. Контекстно инженерство

You Might Also Like

Claude Code Buddy 修改指南：如何获得闪光传说级宠物

Obsidian пусна Defuddle, повишавайки Obsidian Web Clipper до ново ниво

OpenAI внезапно обяви "три в едно": сливане на браузър, програмиране и ChatGPT, вътрешно признавайки, че е поело грешен курс през последната година

2026, не се насилвайте да бъдете "дисциплинирани"! Правете тези 8 малки неща и здравето ще дойде естествено

Майките, които се опитват да отслабнат, но не успяват, определено са попаднали тук

AI Browser 24小时稳定运行指南