Огляд RAG та Agent&LLM пам'яті на 107 сторінок

Сьогодні ділюся технічним оглядом на 107 сторінок від Женьміньського університету Китаю, Фуданського університету, Пекінського університету та інших під назвою «Пам'ять в епоху AI агентів: Огляд форм, функцій та динаміки».

Адреса проєкту: https://github.com/Shichun-Liu/Agent-Memory-Paper-List

Адреса статті: https://arxiv.org/pdf/2512.13564

За останні два роки ми стали свідками дивовижної еволюції великих мовних моделей (LLM) в AI агентів (AI Agents). Від Deep Research до розробки програмного забезпечення, від наукових відкриттів до багатоагентної співпраці, ці агенти, засновані на базових моделях, розширюють межі штучного загального інтелекту (AGI).

Але виникає ключове питання: як зробити так, щоб агенти могли безперервно навчатися та адаптуватися, якщо статичні параметри LLM не можуть швидко оновлюватися?

Відповідь – пам'ять (Memory).

"Пам'ять – це ключова здатність, яка перетворює статичні LLM на інтелектуальних агентів, здатних постійно адаптуватися через взаємодію з навколишнім середовищем."

Рисунок 1 демонструє запропоновану в статті уніфіковану структуру класифікації, яка організовує пам'ять агентів за трьома вимірами: форми (Forms), функції (Functions), динаміка (Dynamics), і відображає репрезентативні системи в цій системі класифікації.

У статті також чітко розмежовуються Agent Memory та кілька тісно пов'язаних, але принципово різних концепцій: LLM пам'ять, генерація, розширена пошуком (RAG) та контекстна інженерія. Хоча всі вони пов'язані зі зберіганням та використанням інформації, між ними існують ключові відмінності в цілях, механізмах та сценаріях застосування.

Технології пам'яті агентів

Self-Evolving Memory: Memento, H2R
Multimodal Memory: Ella, ViloMem, M3-Agent
Latent Memory: MemoryLLM, M+, MemGen
Parametric Memory: Retroformer, Early experience
RL-enabled Memory: MemAgent, RMM, MemSearcher, MEM1, Mem-alpha, Memory-R1

Пам'ять агентів vs. RAG

Технології, пов'язані з RAG:

Modular RAG: FlashRAG, ComposeRAG
Graph RAG: LightRAG, HippoRAG
Agentic RAG: PlanRAG, Self-RAG

RAG та пам'ять агентів передбачають отримання інформації із зовнішнього сховища для розширення можливостей моделі, але між ними існують принципові відмінності у філософії дизайну:

ХарактеристикаRAGПам'ять агентів Основна метаЗабезпечення підтримки відповідними фоновими знаннями для поточного запитуБезперервне навчання та адаптивна поведінка з плином часу Джерело інформаціїЗазвичай статична, попередньо побудована база знаньДинамічно згенерована, персоналізована інформація з власного досвіду взаємодії агента Тригер пошукуПасивно запускається запитом користувачаАктивно вирішується агентом, коли і що шукати Оновлення інформаціїБаза знань зазвичай оновлюється в автономному режиміОнлайн, безперервне, вибіркове оновлення Цикл зворотного зв'язкуВідсутній прямий механізм зворотного зв'язкуФормує замкнутий цикл із взаємодією з навколишнім середовищем

Ключова відмінність: RAG – це інструмент розширення знань, а пам'ять агентів – це механізм навчання. RAG відповідає на питання "Що я знаю", а пам'ять агентів відповідає на питання "Чого я навчився".

Пам'ять агентів vs. LLM пам'ять

Технології, пов'язані з LLM пам'яттю:

Attention KV management: Mixture-of-Memory
Long context processing: Mamba, Memformer, MoA, Sparseformer, NSA

ВимірLLM Пам'ятьПам'ять агентів ВизначенняЗнання, внутрішньо притаманні параметрам моделі, або тимчасова інформація у вікні контекстуЗовнішня система, яка підтримує безперервну взаємодію агента з навколишнім середовищем, навчання між завданнями та довгострокову адаптацію Масштаб часуОбмежується даними попереднього навчання або поточним контекстом діалогуОхоплює кілька завдань, сеансів, підтримує навчання протягом усього життя Можливість оновленняОновлення параметрів є дорогим, контекстна інформація є непостійноюПідтримує ефективне, вибіркове динамічне оновлення та еволюцію АктивністьПасивно реагує на запитиАктивно вирішує, яку інформацію зберігати, оновлювати та отримувати Зв'язок з навколишнім середовищемВідсутня пряма взаємодія з навколишнім середовищемГлибоко інтегрований зворотний зв'язок з навколишнім середовищем, підтримує інтерактивне навчання

Ключова відмінність: LLM пам'ять по суті є статичною (параметри фіксовані) або короткочасною (контекст обмежений), тоді як пам'ять агентів є динамічною, постійною, пов'язаною з навколишнім середовищем.

Пам'ять агентів vs. Контекстна інженерія

Технології, пов'язані з контекстною інженерією:

Tool-integrated reasoning: ReTool, ToolLLM, Toolformer, VTool-R1, ToRL
Tool selection: AutoTool, VisTA
Communication protocol: ANP, A2A, MCP, Agora

АспектКонтекстна інженеріяПам'ять агентів ФокусОптимізація вхідних даних для одного раунду або поточного завданняПерсистенція та використання інформації між кількома раундами та завданнями Вимір часуПоточний сеансДовготривала історія Вибір інформаціїШтучно розроблені або евристичні правилаАвтоматизовані механізми формування, еволюції та пошуку Управління станомВідсутній постійний станЯвно підтримує еволюційний стан пам'яті

Ключова відмінність: Контекстна інженерія – це техніка оптимізації підказок, а пам'ять агентів – це система управління станом. Перша зосереджується на "Що вводити зараз", а друга – на "Що запам'яталося в минулому, як це впливає на сьогодення та майбутнє".

Огляд RAG та Agent&LLM пам'яті на 107 сторінок

Технології пам'яті агентів

Пам'ять агентів vs. RAG

Пам'ять агентів vs. LLM пам'ять

Пам'ять агентів vs. Контекстна інженерія

You Might Also Like

Claude Code Buddy зміни: як отримати блискучого легендарного улюбленця

Obsidian випустив Defuddle, піднявши Obsidian Web Clipper на новий рівень

OpenAI раптово оголосила про "три в одному": об'єднання браузера, програмування та ChatGPT, внутрішнє визнання помилок минулого року

2026, більше не змушуйте себе "дисциплінуватися"! Зробіть ці 8 простих справ, і здоров'я прийде природно

Ті мами, які намагаються схуднути, але не можуть, безумовно, потрапляють сюди

AI Browser 24 години стабільної роботи: посібник