107-stranová štúdia RAG a Agent&LLM Memory
Dnes zdieľam 107-stranovú technickú štúdiu od Renmin University, Fudan University, Peking University a ďalších s názvom "Memory in the Age of AI Agents: A Survey Forms, Functions and Dynamics".
Adresa projektu: https://github.com/Shichun-Liu/Agent-Memory-Paper-List
Adresa článku: https://arxiv.org/pdf/2512.13564

Za posledné dva roky sme boli svedkami úžasného vývoja rozsiahlych jazykových modelov (LLM) na inteligentných agentov (AI Agents). Od Deep Research po softvérové inžinierstvo, od vedeckých objavov po spoluprácu viacerých agentov, títo agenti založení na základných modeloch posúvajú hranice umelej všeobecnej inteligencie (AGI).
Ale vynára sa kľúčová otázka: Ako môžu mať agenti schopnosť neustáleho učenia a prispôsobovania sa, keďže statické parametre LLM sa nedajú rýchlo aktualizovať?
Odpoveď je – Pamäť (Memory).
"Pamäť je kľúčová schopnosť na premenu statických LLM na inteligentných agentov, ktorí sa dokážu neustále prispôsobovať prostredníctvom interakcie s prostredím."

Obrázok 1 zobrazuje jednotný klasifikačný rámec navrhnutý v článku, ktorý organizuje pamäť agenta podľa troch dimenzií: Formy (Forms), Funkcie (Functions), Dynamika (Dynamics) a mapuje reprezentatívne systémy do tohto klasifikačného systému.

Článok tiež jasne rozlišuje medzi Agent Memory a niekoľkými úzko súvisiacimi, ale zásadne odlišnými konceptmi: LLM Memory, Retrieval-Augmented Generation (RAG) a Context Engineering. Hoci všetky súvisia s ukladaním a využívaním informácií, existujú kľúčové rozdiely v cieľoch, mechanizmoch a aplikačných scenároch.
Technológie pamäte agenta
-
Self-Evolving Memory: Memento, H2R
-
Multimodal Memory: Ella, ViloMem, M3-Agent
-
Latent Memory: MemoryLLM, M+, MemGen
-
Parametric Memory: Retroformer, Early experience
-
RL-enabled Memory: MemAgent, RMM, MemSearcher, MEM1, Mem-alpha, Memory-R1
Agent Memory vs. RAG
RAG súvisiace technológie:
-
Modular RAG: FlashRAG, ComposeRAG
-
Graph RAG: LightRAG, HippoRAG
-
Agentic RAG: PlanRAG, Self-RAG
RAG a Agent Memory zahŕňajú získavanie informácií z externého úložiska na zlepšenie schopností modelu, ale existuje zásadný rozdiel vo filozofii dizajnu medzi týmito dvoma:
FunkciaRAGAgent Memory Kľúčový cieľPoskytnúť relevantnú podporu základných znalostí pre aktuálny dotazNepretržité učenie a adaptívne správanie v priebehu času Zdroj informáciíZvyčajne statická, vopred vytvorená znalostná bázaDynamicky generované, personalizované informácie z vlastných interakčných skúseností agenta Spúšťač vyhľadávaniaPasívne spúšťané používateľským dotazomAktívne rozhodnuté agentom, kedy a čo vyhľadať Aktualizácia informáciíZnalostná báza sa zvyčajne aktualizuje offlineOnline, nepretržite a selektívne aktualizovaná Spätná väzbaŽiadny priamy mechanizmus spätnej väzbyVytvára uzavretú slučku s interakciou s prostredím
Kľúčový rozdiel: RAG je nástroj na rozšírenie znalostí, zatiaľ čo Agent Memory je mechanizmus učenia. RAG odpovedá na otázku "Čo viem?", Agent Memory odpovedá na otázku "Čo som sa naučil?".
Agent Memory vs. LLM Memory
LLM Memory súvisiace technológie:
-
Attention KV management: Mixture-of-Memory
-
Long context processing: Mamba, Memformer, MoA, Sparseformer, NSA
DimenziaLLM MemoryAgent Memory DefiníciaZnalosti internalizované v parametroch modelu alebo dočasné informácie v kontextovom okneExterný systém, ktorý podporuje nepretržitú interakciu agenta s prostredím, učenie sa medzi úlohami a dlhodobú adaptáciu Časová škálaObmedzená na predtrénované dáta alebo aktuálny kontext konverzáciePrekračuje viacero úloh, relácií, podporuje celoživotné učenie AktualizovateľnosťAktualizácia parametrov je nákladná, kontextové informácie sú prchavéPodporuje efektívne, selektívne dynamické aktualizácie a vývoj ProaktivitaPasívne reaguje na dotazyAktívne rozhoduje, ktoré informácie ukladať, aktualizovať a vyhľadávať Spárovanie s prostredímŽiadna priama interakcia s prostredímHlboko integrovaná spätná väzba z prostredia, podporuje interaktívne učenie
Kľúčový rozdiel: LLM Memory je v podstate statická (parametre sú pevné) alebo krátkodobá (kontext je obmedzený), zatiaľ čo Agent Memory je dynamická, trvalá a spojená s prostredím.
Agent Memory vs. Context Engineering
Context Engineering súvisiace technológie:
-
Tool-integrated reasoning: ReTool, ToolLLM, Toolformer, VTool-R1, ToRL
-
Tool selection: AutoTool, VisTA
-
Communication protocol: ANP, A2A, MCP, Agora
HľadiskoContext EngineeringAgent Memory ZameranieOptimalizácia vstupu pre jedno kolo alebo aktuálnu úlohuPerzistentné ukladanie a využívanie informácií v priebehu viacerých kôl a úloh Časová dimenziaAktuálna reláciaDlhá história Výber informáciíRučne navrhnuté alebo heuristické pravidláAutomatizovaný mechanizmus formovania, vývoja a vyhľadávania Správa stavuŽiadny trvalý stavExplicitná údržba vyvíjajúceho sa stavu pamäte
Kľúčový rozdiel: Context Engineering je technika optimalizácie promptov, zatiaľ čo Agent Memory je systém správy stavu. Prvý sa zameriava na "Čo zadať teraz", druhý sa zameriava na "Čo si pamätám z minulosti a ako to ovplyvňuje súčasnosť a budúcnosť".





