Преглед на 107 страници за RAG и Agent&LLM меморија
Денес споделувам технички преглед од 107 страници од Универзитетот Ренмин, Универзитетот Фудан, Универзитетот во Пекинг итн., насловен како „Memory in the Age of AI Agents: A Survey Forms, Functions and Dynamics“ (Меморија во ерата на AI агентите: Преглед на форми, функции и динамика).
Адреса на проектот: https://github.com/Shichun-Liu/Agent-Memory-Paper-List
Адреса на трудот: https://arxiv.org/pdf/2512.13564

Во текот на изминатите две години, бевме сведоци на неверојатната еволуција на големите јазични модели (LLM) во AI интелигентни агенти (AI Agents). Од Deep Research до софтверско инженерство, од научно откритие до соработка со повеќе агенти, овие интелигентни агенти засновани на основни модели ги поместуваат границите на вештачката општа интелигенција (AGI).
Но, се појавува едно клучно прашање: Како да се овозможи на агентите континуирано учење и приспособливост кога статичните LLM параметри не можат брзо да се ажурираат?
Одговорот е - меморија (Memory).
„Меморијата е клучната способност да се трансформираат статичните LLM во интелигентни агенти кои можат континуирано да се прилагодуваат преку интеракција со околината.“

Figure 1 (Слика 1) го прикажува унифицираниот рамковен модел предложен во трудот, кој ја организира меморијата на агентот според три димензии: форми (Forms), функции (Functions) и динамика (Dynamics), и ги мапира репрезентативните системи во овој систем на класификација.

Трудот, исто така, прави јасна разлика помеѓу Agent Memory и неколку тесно поврзани, но суштински различни концепти: LLM меморија, Retrieval-Augmented Generation (RAG) (Генерирање збогатено со пребарување (RAG)) и context engineering (контекстуален инженеринг). Иако сите тие се поврзани со складирање и користење на информации, постојат клучни разлики во целите, механизмите и сценаријата за апликација.
Технологии за меморија на агенти
-
Self-Evolving Memory (Само-еволуирачка меморија): Memento, H2R
-
Multimodal Memory (Мултимодална меморија): Ella, ViloMem, M3-Agent
-
Latent Memory (Латентна меморија): MemoryLLM, M+, MemGen
-
Parametric Memory (Параметриска меморија): Retroformer, Early experience
-
RL-enabled Memory (Меморија овозможена со RL): MemAgent, RMM, MemSearcher, MEM1, Mem-alpha, Memory-R1
Меморија на агенти vs. RAG
RAG поврзани технологии:
-
Modular RAG (Модуларен RAG): FlashRAG, ComposeRAG
-
Graph RAG (Графички RAG): LightRAG, HippoRAG
-
Agentic RAG (Агентички RAG): PlanRAG, Self-RAG
RAG и меморијата на агентите вклучуваат пребарување информации од надворешно складирање за да се подобрат способностите на моделот, но постои суштинска разлика во дизајнерската филозофија помеѓу двете:
КарактеристикаRAGМеморија на агенти Основна целОбезбедување релевантна поддршка за позадина за тековното барањеКонтинуирано учење и адаптивно однесување со текот на времето Извор на информацииОбично статична, претходно изградена база на знаењеДинамички генерирани, персонализирани информации од сопственото интерактивно искуство на агентот Активирање на пребарувањеПасивно активирано од корисничко барањеАктивно одлучено од агентот кога и што да пребарува Ажурирање на информацииБазата на знаење обично се ажурира офлајнОнлајн, континуирано и селективно ажурирање Повратна јамкаНема директен механизам за повратна информацијаФормира затворена јамка со интеракција со околината
Клучна разлика: RAG е алатка за проширување на знаењето, додека меморијата на агентот е механизам за учење. RAG одговара на „Што знам“, а меморијата на агентот одговара на „Што научив“.
Меморија на агенти vs. LLM меморија
LLM поврзани технологии за меморија:
-
Attention KV management (Управување со внимание KV): Mixture-of-Memory
-
Long context processing (Обработка на долг контекст): Mamba, Memformer, MoA, Sparseformer, NSA
ДимензијаLLM меморијаМеморија на агенти ДефиницијаИнтернализирано знаење во параметрите на моделот или привремени информации во контекстуалниот прозорецНадворешен систем кој поддржува континуирана интеракција на агентот со околината, учење преку задачи и долгорочна адаптација Временска скалаОграничено на податоци за претходно тренирање или тековен контекст на дијалогСе протега на повеќе задачи, сесии и поддржува доживотно учење АжурирањеТрошоците за ажурирање на параметрите се високи, а контекстуалните информации се нестабилниПоддржува ефикасно, селективно динамичко ажурирање и еволуција АктивностПасивно одговара на барањаАктивно одлучува што да складира, ажурира и пребарува Поврзаност со околинатаНема директна интеракција со околинатаДлабоко интегрирана повратна информација од околината, поддржува интерактивно учење
Клучна разлика: LLM меморијата е во суштина статична (фиксирани параметри) или краткотрајна (ограничен контекст), додека меморијата на агентот е динамична, постојана и поврзана со околината.
Меморија на агенти vs. Контекстуален инженеринг
Контекстуален инженеринг поврзани технологии:
-
Tool-integrated reasoning (Расудување интегрирано со алатки): ReTool, ToolLLM, Toolformer, VTool-R1, ToRL
-
Tool selection (Избор на алатки): AutoTool, VisTA
-
Communication protocol (Комуникациски протокол): ANP, A2A, MCP, Agora
АспектКонтекстуален инженерингМеморија на агенти ФокусОптимизација на влез за еднократно или тековно извршување на задачаТрајно зачувување и користење на информации преку повеќекратни извршувања на задачи Временска димензијаТековна сесијаДолга историја Избор на информацииРачно дизајнирани или хеуристички правилаАвтоматизиран механизам за формирање, еволуција и пребарување Управување со состојбаНема трајна состојбаЕксплицитно одржување на еволуирачка состојба на меморија
Клучна разлика: Контекстуалниот инженеринг е техника за оптимизација на поттикнување, додека меморијата на агентот е систем за управување со состојби. Првиот се фокусира на „Што да се внесе сега“, а вториот се фокусира на „Што се запаметило во минатото и како тоа влијае на сегашноста и иднината“.





