Једна студија од 107 страна о RAG и Agent&LLM меморији

Данас делим технички преглед од 107 страна са Универзитета Ренмин, Фудан, Пекинг и других, под називом „Меморија у доба АИ агената: Преглед форми, функција и динамике“.

Адреса пројекта: https://github.com/Shichun-Liu/Agent-Memory-Paper-List

Адреса рада: https://arxiv.org/pdf/2512.13564

У последње две године, били смо сведоци невероватне еволуције великих језичких модела (LLM) у АИ агенте (AI Agents). Од Deep Research до софтверског инжењеринга, од научног открића до колаборације више агената, ови агенти засновани на основним моделима померају границе вештачке опште интелигенције (AGI).

Али се појављује једно кључно питање: Како омогућити агентима да имају континуирано учење и прилагодљивост када се статички LLM параметри не могу брзо ажурирати?

Одговор је – меморија (Memory).

„Меморија је кључна способност за претварање статичких LLM-ова у интелигентне агенте који се могу континуирано прилагођавати кроз интеракцију са окружењем.“

Figure 1 приказује јединствени оквир за класификацију предложен у раду, који организује меморију агента према три димензије: формама (Forms), функцијама (Functions) и динамици (Dynamics), и мапира репрезентативне системе у овај систем класификације.

Рад такође јасно разликује Agent Memory од неколико уско повезаних, али суштински различитих концепата: LLM меморија, генерисање појачано претрагом (RAG) и инжењеринг контекста . Иако су сви они повезани са складиштењем и коришћењем информација, постоје кључне разлике у циљевима, механизмима и сценаријима примене.

Технологија меморије агента

Self-Evolving Memory: Memento, H2R
Multimodal Memory: Ella, ViloMem, M3-Agent
Latent Memory: MemoryLLM, M+, MemGen
Parametric Memory: Retroformer, Early experience
RL-enabled Memory: MemAgent, RMM, MemSearcher, MEM1, Mem-alpha, Memory-R1

Меморија агента vs. RAG

RAG сродне технологије:

Modular RAG: FlashRAG, ComposeRAG
Graph RAG: LightRAG, HippoRAG
Agentic RAG: PlanRAG, Self-RAG

RAG и меморија агента укључују преузимање информација из екстерне меморије да би се побољшале могућности модела, али постоји суштинска разлика у филозофији дизајна између њих:

КарактеристикаRAGМеморија агента Основни циљПружање релевантне позадинске подршке за тренутни упитКонтинуирано учење и прилагодљиво понашање током времена Извор информацијаОбично статичка, унапред изграђена база знањаДинамички генерисане, персонализоване информације из искуства интеракције самог агента Окидач за преузимањеПасивно покренут корисничким упитомАгент активно одлучује када и шта да преузме Ажурирање информацијаБаза знања се обично ажурира ван мрежеОнлајн, континуирано и селективно ажурирање Повратна спрегаНема директног механизма повратне спрегеФормира затворену петљу са интеракцијом са окружењем

Кључна разлика: RAG је алат за проширење знања, док је меморија агента механизам учења. RAG одговара на „Шта знам“, а меморија агента одговара на „Шта сам научио“.

Меморија агента vs. LLM меморија

LLM сродне технологије меморије:

Attention KV management: Mixture-of-Memory
Long context processing: Mamba, Memformer, MoA, Sparseformer, NSA

ДимензијаLLM меморијаМеморија агента ДефиницијаИнтернализовано знање у параметрима модела или привремене информације у контекстуалном прозоруЕкстерни систем који подржава континуирану интеракцију агента са окружењем, учење кроз задатке и дугорочну адаптацију Временска скалаОграничена на податке о претходном тренингу или тренутни контекст дијалогаОбухвата више задатака, сесија и подржава доживотно учење Могућност ажурирањаВисоки трошкови ажурирања параметара, контекстуалне информације су лако испарљивеПодржава ефикасно, селективно динамичко ажурирање и еволуцију АктивностПасивно реаговање на упитеАктивно одлучује шта да складишти, ажурира и преузима Повезаност са окружењемНема директне интеракције са окружењемДубоко интегрисан са повратним информацијама из окружења, подржава интерактивно учење

Кључна разлика: LLM меморија је у суштини статичка (параметри су фиксни) или краткотрајна (контекст је ограничен), док је меморија агента динамичка, трајна и повезана са окружењем.

Меморија агента vs. Инжењеринг контекста

Технологије повезане са инжењерингом контекста:

Tool-integrated reasoning: ReTool, ToolLLM, Toolformer, VTool-R1, ToRL
Tool selection: AutoTool, VisTA
Communication protocol: ANP, A2A, MCP, Agora

АспектИнжењеринг контекстаМеморија агента ФокусОптимизација улаза за један круг или тренутни задатакТрајност и коришћење информација кроз више кругова и задатака Временска димензијаТренутна сесијаДугорочна историја Избор информацијаРучно дизајнирана или хеуристичка правилаАутоматизовани механизми формирања, еволуције и преузимања Управљање стањемНема трајног стањаЕксплицитно одржавање еволуирајућег стања меморије

Кључна разлика: Инжењеринг контекста је техника оптимизације упита, а меморија агента је систем за управљање стањем. Први се фокусира на „Шта унети сада“, а други се фокусира на „Шта је запамћено у прошлости и како то утиче на садашњост и будућност“.

Једна студија од 107 страна о RAG и Agent&LLM меморији

Технологија меморије агента

Меморија агента vs. RAG

Меморија агента vs. LLM меморија

Меморија агента vs. Инжењеринг контекста

You Might Also Like

Claude Code Buddy модификација: Како добити сјајног легендарног љубимца

Obsidian je lansirao Defuddle, podigao Obsidian Web Clipper na novi nivo

OpenAI iznenada najavljuje "tri u jednom": spajanje pretraživača + programiranja + ChatGPT, unutrašnje priznanje da su prošle godine pogrešili

2026, ne prisiljavajte se na "disciplinu"! Uradite ovih 8 malih stvari, zdravlje će doći prirodno

One of the reasons why mothers who work hard to lose weight can't succeed is definitely here

AI Browser 24-сатна стабилна операција