Једна студија од 107 страна о RAG и Agent&LLM меморији
Данас делим технички преглед од 107 страна са Универзитета Ренмин, Фудан, Пекинг и других, под називом „Меморија у доба АИ агената: Преглед форми, функција и динамике“.
Адреса пројекта: https://github.com/Shichun-Liu/Agent-Memory-Paper-List
Адреса рада: https://arxiv.org/pdf/2512.13564

У последње две године, били смо сведоци невероватне еволуције великих језичких модела (LLM) у АИ агенте (AI Agents). Од Deep Research до софтверског инжењеринга, од научног открића до колаборације више агената, ови агенти засновани на основним моделима померају границе вештачке опште интелигенције (AGI).
Али се појављује једно кључно питање: Како омогућити агентима да имају континуирано учење и прилагодљивост када се статички LLM параметри не могу брзо ажурирати?
Одговор је – меморија (Memory).
„Меморија је кључна способност за претварање статичких LLM-ова у интелигентне агенте који се могу континуирано прилагођавати кроз интеракцију са окружењем.“

Figure 1 приказује јединствени оквир за класификацију предложен у раду, који организује меморију агента према три димензије: формама (Forms), функцијама (Functions) и динамици (Dynamics), и мапира репрезентативне системе у овај систем класификације.

Рад такође јасно разликује Agent Memory од неколико уско повезаних, али суштински различитих концепата: LLM меморија, генерисање појачано претрагом (RAG) и инжењеринг контекста . Иако су сви они повезани са складиштењем и коришћењем информација, постоје кључне разлике у циљевима, механизмима и сценаријима примене.
Технологија меморије агента
-
Self-Evolving Memory: Memento, H2R
-
Multimodal Memory: Ella, ViloMem, M3-Agent
-
Latent Memory: MemoryLLM, M+, MemGen
-
Parametric Memory: Retroformer, Early experience
-
RL-enabled Memory: MemAgent, RMM, MemSearcher, MEM1, Mem-alpha, Memory-R1
Меморија агента vs. RAG
RAG сродне технологије:
-
Modular RAG: FlashRAG, ComposeRAG
-
Graph RAG: LightRAG, HippoRAG
-
Agentic RAG: PlanRAG, Self-RAG
RAG и меморија агента укључују преузимање информација из екстерне меморије да би се побољшале могућности модела, али постоји суштинска разлика у филозофији дизајна између њих:
КарактеристикаRAGМеморија агента Основни циљПружање релевантне позадинске подршке за тренутни упитКонтинуирано учење и прилагодљиво понашање током времена Извор информацијаОбично статичка, унапред изграђена база знањаДинамички генерисане, персонализоване информације из искуства интеракције самог агента Окидач за преузимањеПасивно покренут корисничким упитомАгент активно одлучује када и шта да преузме Ажурирање информацијаБаза знања се обично ажурира ван мрежеОнлајн, континуирано и селективно ажурирање Повратна спрегаНема директног механизма повратне спрегеФормира затворену петљу са интеракцијом са окружењем
Кључна разлика: RAG је алат за проширење знања, док је меморија агента механизам учења. RAG одговара на „Шта знам“, а меморија агента одговара на „Шта сам научио“.
Меморија агента vs. LLM меморија
LLM сродне технологије меморије:
-
Attention KV management: Mixture-of-Memory
-
Long context processing: Mamba, Memformer, MoA, Sparseformer, NSA
ДимензијаLLM меморијаМеморија агента ДефиницијаИнтернализовано знање у параметрима модела или привремене информације у контекстуалном прозоруЕкстерни систем који подржава континуирану интеракцију агента са окружењем, учење кроз задатке и дугорочну адаптацију Временска скалаОграничена на податке о претходном тренингу или тренутни контекст дијалогаОбухвата више задатака, сесија и подржава доживотно учење Могућност ажурирањаВисоки трошкови ажурирања параметара, контекстуалне информације су лако испарљивеПодржава ефикасно, селективно динамичко ажурирање и еволуцију АктивностПасивно реаговање на упитеАктивно одлучује шта да складишти, ажурира и преузима Повезаност са окружењемНема директне интеракције са окружењемДубоко интегрисан са повратним информацијама из окружења, подржава интерактивно учење
Кључна разлика: LLM меморија је у суштини статичка (параметри су фиксни) или краткотрајна (контекст је ограничен), док је меморија агента динамичка, трајна и повезана са окружењем.
Меморија агента vs. Инжењеринг контекста
Технологије повезане са инжењерингом контекста:
-
Tool-integrated reasoning: ReTool, ToolLLM, Toolformer, VTool-R1, ToRL
-
Tool selection: AutoTool, VisTA
-
Communication protocol: ANP, A2A, MCP, Agora
АспектИнжењеринг контекстаМеморија агента ФокусОптимизација улаза за један круг или тренутни задатакТрајност и коришћење информација кроз више кругова и задатака Временска димензијаТренутна сесијаДугорочна историја Избор информацијаРучно дизајнирана или хеуристичка правилаАутоматизовани механизми формирања, еволуције и преузимања Управљање стањемНема трајног стањаЕксплицитно одржавање еволуирајућег стања меморије
Кључна разлика: Инжењеринг контекста је техника оптимизације упита, а меморија агента је систем за управљање стањем. Први се фокусира на „Шта унети сада“, а други се фокусира на „Шта је запамћено у прошлости и како то утиче на садашњост и будућност“.





