Преглед на 107 страници за RAG и Agent&LLM памет

2/15/2026
4 min read

Днес споделям технически преглед от 107 страници от Renmin University, Fudan University, Peking University и др., озаглавен „Memory in the Age of AI Agents: A Survey Forms, Functions and Dynamics“.

Адрес на проекта: https://github.com/Shichun-Liu/Agent-Memory-Paper-List

Адрес на статията: https://arxiv.org/pdf/2512.13564

През последните две години станахме свидетели на невероятната еволюция на големите езикови модели (LLM) в AI агенти (AI Agents). От Deep Research до софтуерно инженерство, от научни открития до сътрудничество между множество агенти, тези интелигентни агенти, базирани на основни модели, тласкат границите на общия изкуствен интелект (AGI).

Но се появява основен въпрос: Как да позволим на агентите да имат непрекъснато обучение и адаптивност, когато статичните LLM параметри не могат да бъдат актуализирани бързо?

Отговорът е – памет (Memory).

"Паметта е ключовата способност да се трансформират статичните LLM в интелигентни агенти, които могат непрекъснато да се адаптират чрез взаимодействие с околната среда."

Фигура 1 показва унифицираната рамка за класификация, предложена в статията, която организира паметта на агента според три измерения: форми (Forms), функции (Functions) и динамика (Dynamics), и картографира представителни системи в тази класификационна система.

Статията също така прави ясно разграничение между Agent Memory и няколко тясно свързани, но по същество различни концепции: LLM памет, извличане-разширена генерация (RAG) и контекстно инженерство. Въпреки че всички те са свързани със съхранението и използването на информация, има ключови разлики в целите, механизмите и сценариите на приложение.

Технологии за памет на агенти

  • Self-Evolving Memory: Memento, H2R

  • Multimodal Memory: Ella, ViloMem, M3-Agent

  • Latent Memory: MemoryLLM, M+, MemGen

  • Parametric Memory: Retroformer, Early experience

  • RL-enabled Memory: MemAgent, RMM, MemSearcher, MEM1, Mem-alpha, Memory-R1

Agent Memory vs. RAG

RAG свързани технологии:

  • Modular RAG: FlashRAG, ComposeRAG

  • Graph RAG: LightRAG, HippoRAG

  • Agentic RAG: PlanRAG, Self-RAG

RAG и паметта на агента включват извличане на информация от външно хранилище, за да се подобри способността на модела, но има съществена разлика във философията на дизайна между двете:

ХарактеристикаRAGПамет на агента Основна целОсигуряване на подходяща подкрепа за фонова информация за текущата заявкаНепрекъснато обучение и адаптивно поведение във времето Източник на информацияОбикновено статични, предварително изградени бази знанияДинамично генерирана, персонализирана информация от собствения опит на агента Задействане на извличанеПасивно задействано от потребителска заявкаАктивно решено от агента кога и какво да извлече Актуализация на информациятаБазите знания обикновено се актуализират офлайнОнлайн, непрекъснато и селективно актуализиране Обратна връзкаНяма механизъм за директна обратна връзкаЗатворен цикъл с взаимодействие с околната среда

Ключова разлика: RAG е инструмент за разширяване на знанията, докато паметта на агента е механизъм за обучение. RAG отговаря на въпроса „Какво знам“, а паметта на агента отговаря на въпроса „Какво научих“.

Agent Memory vs. LLM Memory

LLM свързани технологии за памет:

  • Attention KV management: Mixture-of-Memory

  • Long context processing: Mamba, Memformer, MoA, Sparseformer, NSA

ИзмерениеLLM паметПамет на агента ОпределениеИнтегрирани знания в параметрите на модела или временна информация в контекстния прозорецВъншна система, която поддържа непрекъснато взаимодействие на агента с околната среда, обучение между задачи и дългосрочна адаптация Времева скалаОграничена до предварително обучени данни или текущ контекст на разговорОбхваща множество задачи, сесии и поддържа учене през целия живот Възможност за актуализиранеРазходите за актуализиране на параметрите са високи, а контекстната информация е нестабилнаПоддържа ефективна, селективна динамична актуализация и еволюция ПроактивностПасивно отговаря на заявкиАктивно решава каква информация да съхранява, актуализира и извлича Свързаност с околната средаНяма директно взаимодействие с околната средаДълбоко интегрирана обратна връзка от околната среда, поддържа интерактивно обучение

Ключова разлика: LLM паметта е по същество статична (фиксирани параметри) или краткотрайна (ограничен контекст), докато паметта на агента е динамична, постоянна и свързана с околната среда.

Agent Memory vs. Контекстно инженерство

Контекстно инженерство свързани технологии:

  • Tool-integrated reasoning: ReTool, ToolLLM, Toolformer, VTool-R1, ToRL

  • Tool selection: AutoTool, VisTA

  • Communication protocol: ANP, A2A, MCP, Agora

АспектКонтекстно инженерствоПамет на агента ФокусОптимизация на входа за единичен или текущ проблемПерсистиране и използване на информация в множество кръгове и задачи Времево измерениеТекуща сесияДълга история Избор на информацияРъчно проектирани или евристични правилаАвтоматизиран механизъм за формиране, еволюция и извличане Управление на състояниетоНяма постоянно състояниеЯвно поддържа еволюиращо състояние на паметта

Ключова разлика: Контекстното инженерство е техника за оптимизация на подканите, а паметта на агента е система за управление на състоянието. Първото се фокусира върху „Какво да въведем сега“, а второто се фокусира върху „Какво е запомнено в миналото и как влияе на настоящето и бъдещето“.

Published in Technology

You Might Also Like

Как да използвате облачни технологии: Пълен наръчник за изграждане на вашата първа облачна инфраструктураTechnology

Как да използвате облачни технологии: Пълен наръчник за изграждане на вашата първа облачна инфраструктура

Как да използвате облачни технологии: Пълен наръчник за изграждане на вашата първа облачна инфраструктура Въведение С ус...

Предупреждение! Бащата на Claude Code открито заявява: След месец, без Plan Mode, титлата софтуерен инженер ще изчезнеTechnology

Предупреждение! Бащата на Claude Code открито заявява: След месец, без Plan Mode, титлата софтуерен инженер ще изчезне

Предупреждение! Бащата на Claude Code открито заявява: След месец, без Plan Mode, титлата софтуерен инженер ще изчезне ...

2026年 Top 10 深度学习资源推荐Technology

2026年 Top 10 深度学习资源推荐

2026年 Top 10 深度学习资源推荐 С развитието на дълбокото обучение в различни области, все повече учебни ресурси и инструменти се ...

2026年 Top 10 AI 代理:核心卖点解析Technology

2026年 Top 10 AI 代理:核心卖点解析

2026年 Top 10 AI 代理:核心卖点解析 引言 С бързото развитие на изкуствения интелект, AI агенти (AI Agents) станаха гореща тема в тех...

2026年 Top 10 AI 工具推荐:释放人工智能的真正潜力Technology

2026年 Top 10 AI 工具推荐:释放人工智能的真正潜力

2026年 Top 10 AI 工具推荐:释放人工智能的真正潜力 В днешния ден, когато технологиите напредват с бързи темпове, изкуственият интелект (AI...

2026年 Top 10 AWS工具和资源推荐Technology

2026年 Top 10 AWS工具和资源推荐

2026年 Top 10 AWS工具和资源推荐 В бързо развиващата се област на облачните изчисления, Amazon Web Services (AWS) винаги е била л...