Огляд RAG та Agent&LLM пам'яті на 107 сторінок

2/15/2026
4 min read

Сьогодні ділюся технічним оглядом на 107 сторінок від Женьміньського університету Китаю, Фуданського університету, Пекінського університету та інших під назвою «Пам'ять в епоху AI агентів: Огляд форм, функцій та динаміки».

Адреса проєкту: https://github.com/Shichun-Liu/Agent-Memory-Paper-List

Адреса статті: https://arxiv.org/pdf/2512.13564

За останні два роки ми стали свідками дивовижної еволюції великих мовних моделей (LLM) в AI агентів (AI Agents). Від Deep Research до розробки програмного забезпечення, від наукових відкриттів до багатоагентної співпраці, ці агенти, засновані на базових моделях, розширюють межі штучного загального інтелекту (AGI).

Але виникає ключове питання: як зробити так, щоб агенти могли безперервно навчатися та адаптуватися, якщо статичні параметри LLM не можуть швидко оновлюватися?

Відповідь – пам'ять (Memory).

"Пам'ять – це ключова здатність, яка перетворює статичні LLM на інтелектуальних агентів, здатних постійно адаптуватися через взаємодію з навколишнім середовищем."

Рисунок 1 демонструє запропоновану в статті уніфіковану структуру класифікації, яка організовує пам'ять агентів за трьома вимірами: форми (Forms), функції (Functions), динаміка (Dynamics), і відображає репрезентативні системи в цій системі класифікації.

У статті також чітко розмежовуються Agent Memory та кілька тісно пов'язаних, але принципово різних концепцій: LLM пам'ять, генерація, розширена пошуком (RAG) та контекстна інженерія. Хоча всі вони пов'язані зі зберіганням та використанням інформації, між ними існують ключові відмінності в цілях, механізмах та сценаріях застосування.

Технології пам'яті агентів

  • Self-Evolving Memory: Memento, H2R

  • Multimodal Memory: Ella, ViloMem, M3-Agent

  • Latent Memory: MemoryLLM, M+, MemGen

  • Parametric Memory: Retroformer, Early experience

  • RL-enabled Memory: MemAgent, RMM, MemSearcher, MEM1, Mem-alpha, Memory-R1

Пам'ять агентів vs. RAG

Технології, пов'язані з RAG:

  • Modular RAG: FlashRAG, ComposeRAG

  • Graph RAG: LightRAG, HippoRAG

  • Agentic RAG: PlanRAG, Self-RAG

RAG та пам'ять агентів передбачають отримання інформації із зовнішнього сховища для розширення можливостей моделі, але між ними існують принципові відмінності у філософії дизайну:

ХарактеристикаRAGПам'ять агентів Основна метаЗабезпечення підтримки відповідними фоновими знаннями для поточного запитуБезперервне навчання та адаптивна поведінка з плином часу Джерело інформаціїЗазвичай статична, попередньо побудована база знаньДинамічно згенерована, персоналізована інформація з власного досвіду взаємодії агента Тригер пошукуПасивно запускається запитом користувачаАктивно вирішується агентом, коли і що шукати Оновлення інформаціїБаза знань зазвичай оновлюється в автономному режиміОнлайн, безперервне, вибіркове оновлення Цикл зворотного зв'язкуВідсутній прямий механізм зворотного зв'язкуФормує замкнутий цикл із взаємодією з навколишнім середовищем

Ключова відмінність: RAG – це інструмент розширення знань, а пам'ять агентів – це механізм навчання. RAG відповідає на питання "Що я знаю", а пам'ять агентів відповідає на питання "Чого я навчився".

Пам'ять агентів vs. LLM пам'ять

Технології, пов'язані з LLM пам'яттю:

  • Attention KV management: Mixture-of-Memory

  • Long context processing: Mamba, Memformer, MoA, Sparseformer, NSA

ВимірLLM Пам'ятьПам'ять агентів ВизначенняЗнання, внутрішньо притаманні параметрам моделі, або тимчасова інформація у вікні контекстуЗовнішня система, яка підтримує безперервну взаємодію агента з навколишнім середовищем, навчання між завданнями та довгострокову адаптацію Масштаб часуОбмежується даними попереднього навчання або поточним контекстом діалогуОхоплює кілька завдань, сеансів, підтримує навчання протягом усього життя Можливість оновленняОновлення параметрів є дорогим, контекстна інформація є непостійноюПідтримує ефективне, вибіркове динамічне оновлення та еволюцію АктивністьПасивно реагує на запитиАктивно вирішує, яку інформацію зберігати, оновлювати та отримувати Зв'язок з навколишнім середовищемВідсутня пряма взаємодія з навколишнім середовищемГлибоко інтегрований зворотний зв'язок з навколишнім середовищем, підтримує інтерактивне навчання

Ключова відмінність: LLM пам'ять по суті є статичною (параметри фіксовані) або короткочасною (контекст обмежений), тоді як пам'ять агентів є динамічною, постійною, пов'язаною з навколишнім середовищем.

Пам'ять агентів vs. Контекстна інженерія

Технології, пов'язані з контекстною інженерією:

  • Tool-integrated reasoning: ReTool, ToolLLM, Toolformer, VTool-R1, ToRL

  • Tool selection: AutoTool, VisTA

  • Communication protocol: ANP, A2A, MCP, Agora

АспектКонтекстна інженеріяПам'ять агентів ФокусОптимізація вхідних даних для одного раунду або поточного завданняПерсистенція та використання інформації між кількома раундами та завданнями Вимір часуПоточний сеансДовготривала історія Вибір інформаціїШтучно розроблені або евристичні правилаАвтоматизовані механізми формування, еволюції та пошуку Управління станомВідсутній постійний станЯвно підтримує еволюційний стан пам'яті

Ключова відмінність: Контекстна інженерія – це техніка оптимізації підказок, а пам'ять агентів – це система управління станом. Перша зосереджується на "Що вводити зараз", а друга – на "Що запам'яталося в минулому, як це впливає на сьогодення та майбутнє".

Published in Technology

You Might Also Like

Як використовувати технології хмарних обчислень: повний посібник зі створення вашої першої хмарної інфраструктуриTechnology

Як використовувати технології хмарних обчислень: повний посібник зі створення вашої першої хмарної інфраструктури

Як використовувати технології хмарних обчислень: повний посібник зі створення вашої першої хмарної інфраструктури Вступ ...

Попередження! Батько Claude Code прямо заявляє: через місяць без Plan Mode титул програміста зникнеTechnology

Попередження! Батько Claude Code прямо заявляє: через місяць без Plan Mode титул програміста зникне

Попередження! Батько Claude Code прямо заявляє: через місяць без Plan Mode титул програміста зникне Нещодавно в YC відб...

2026年 Top 10 深度学习资源推荐Technology

2026年 Top 10 深度学习资源推荐

2026年 Top 10 深度学习资源推荐 随着深度学习在各个领域的迅速发展,越来越多的学习资源和工具涌现出来。本文将为您推荐2026年最值得关注的十个深度学习资源,帮助您在这一领域中快速成长。 1. Coursera Deep Learn...

2026 рік Топ 10 AI агентів: аналіз основних перевагTechnology

2026 рік Топ 10 AI агентів: аналіз основних переваг

2026 рік Топ 10 AI агентів: аналіз основних переваг Вступ З розвитком штучного інтелекту AI агенти стали гарячою темою у...

Рекомендації топ-10 AI інструментів 2026 року: розкриття справжнього потенціалу штучного інтелектуTechnology

Рекомендації топ-10 AI інструментів 2026 року: розкриття справжнього потенціалу штучного інтелекту

Рекомендації топ-10 AI інструментів 2026 року: розкриття справжнього потенціалу штучного інтелекту У часи швидкого розви...

2026年 Top 10 AWS工具和资源推荐Technology

2026年 Top 10 AWS工具和资源推荐

2026年 Top 10 AWS工具和资源推荐 У швидко розвиваючійся сфері хмарних обчислень Amazon Web Services (AWS) завжди була лідером, пр...