107-stranová štúdia RAG a Agent&LLM Memory

Dnes zdieľam 107-stranovú technickú štúdiu od Renmin University, Fudan University, Peking University a ďalších s názvom "Memory in the Age of AI Agents: A Survey Forms, Functions and Dynamics".

Adresa projektu: https://github.com/Shichun-Liu/Agent-Memory-Paper-List

Adresa článku: https://arxiv.org/pdf/2512.13564

Za posledné dva roky sme boli svedkami úžasného vývoja rozsiahlych jazykových modelov (LLM) na inteligentných agentov (AI Agents). Od Deep Research po softvérové inžinierstvo, od vedeckých objavov po spoluprácu viacerých agentov, títo agenti založení na základných modeloch posúvajú hranice umelej všeobecnej inteligencie (AGI).

Ale vynára sa kľúčová otázka: Ako môžu mať agenti schopnosť neustáleho učenia a prispôsobovania sa, keďže statické parametre LLM sa nedajú rýchlo aktualizovať?

Odpoveď je – Pamäť (Memory).

"Pamäť je kľúčová schopnosť na premenu statických LLM na inteligentných agentov, ktorí sa dokážu neustále prispôsobovať prostredníctvom interakcie s prostredím."

Obrázok 1 zobrazuje jednotný klasifikačný rámec navrhnutý v článku, ktorý organizuje pamäť agenta podľa troch dimenzií: Formy (Forms), Funkcie (Functions), Dynamika (Dynamics) a mapuje reprezentatívne systémy do tohto klasifikačného systému.

Článok tiež jasne rozlišuje medzi Agent Memory a niekoľkými úzko súvisiacimi, ale zásadne odlišnými konceptmi: LLM Memory, Retrieval-Augmented Generation (RAG) a Context Engineering. Hoci všetky súvisia s ukladaním a využívaním informácií, existujú kľúčové rozdiely v cieľoch, mechanizmoch a aplikačných scenároch.

Technológie pamäte agenta

Self-Evolving Memory: Memento, H2R
Multimodal Memory: Ella, ViloMem, M3-Agent
Latent Memory: MemoryLLM, M+, MemGen
Parametric Memory: Retroformer, Early experience
RL-enabled Memory: MemAgent, RMM, MemSearcher, MEM1, Mem-alpha, Memory-R1

Agent Memory vs. RAG

RAG súvisiace technológie:

Modular RAG: FlashRAG, ComposeRAG
Graph RAG: LightRAG, HippoRAG
Agentic RAG: PlanRAG, Self-RAG

RAG a Agent Memory zahŕňajú získavanie informácií z externého úložiska na zlepšenie schopností modelu, ale existuje zásadný rozdiel vo filozofii dizajnu medzi týmito dvoma:

FunkciaRAGAgent Memory Kľúčový cieľPoskytnúť relevantnú podporu základných znalostí pre aktuálny dotazNepretržité učenie a adaptívne správanie v priebehu času Zdroj informáciíZvyčajne statická, vopred vytvorená znalostná bázaDynamicky generované, personalizované informácie z vlastných interakčných skúseností agenta Spúšťač vyhľadávaniaPasívne spúšťané používateľským dotazomAktívne rozhodnuté agentom, kedy a čo vyhľadať Aktualizácia informáciíZnalostná báza sa zvyčajne aktualizuje offlineOnline, nepretržite a selektívne aktualizovaná Spätná väzbaŽiadny priamy mechanizmus spätnej väzbyVytvára uzavretú slučku s interakciou s prostredím

Kľúčový rozdiel: RAG je nástroj na rozšírenie znalostí, zatiaľ čo Agent Memory je mechanizmus učenia. RAG odpovedá na otázku "Čo viem?", Agent Memory odpovedá na otázku "Čo som sa naučil?".

Agent Memory vs. LLM Memory

LLM Memory súvisiace technológie:

Attention KV management: Mixture-of-Memory
Long context processing: Mamba, Memformer, MoA, Sparseformer, NSA

DimenziaLLM MemoryAgent Memory DefiníciaZnalosti internalizované v parametroch modelu alebo dočasné informácie v kontextovom okneExterný systém, ktorý podporuje nepretržitú interakciu agenta s prostredím, učenie sa medzi úlohami a dlhodobú adaptáciu Časová škálaObmedzená na predtrénované dáta alebo aktuálny kontext konverzáciePrekračuje viacero úloh, relácií, podporuje celoživotné učenie AktualizovateľnosťAktualizácia parametrov je nákladná, kontextové informácie sú prchavéPodporuje efektívne, selektívne dynamické aktualizácie a vývoj ProaktivitaPasívne reaguje na dotazyAktívne rozhoduje, ktoré informácie ukladať, aktualizovať a vyhľadávať Spárovanie s prostredímŽiadna priama interakcia s prostredímHlboko integrovaná spätná väzba z prostredia, podporuje interaktívne učenie

Kľúčový rozdiel: LLM Memory je v podstate statická (parametre sú pevné) alebo krátkodobá (kontext je obmedzený), zatiaľ čo Agent Memory je dynamická, trvalá a spojená s prostredím.

Agent Memory vs. Context Engineering

Context Engineering súvisiace technológie:

Tool-integrated reasoning: ReTool, ToolLLM, Toolformer, VTool-R1, ToRL
Tool selection: AutoTool, VisTA
Communication protocol: ANP, A2A, MCP, Agora

HľadiskoContext EngineeringAgent Memory ZameranieOptimalizácia vstupu pre jedno kolo alebo aktuálnu úlohuPerzistentné ukladanie a využívanie informácií v priebehu viacerých kôl a úloh Časová dimenziaAktuálna reláciaDlhá história Výber informáciíRučne navrhnuté alebo heuristické pravidláAutomatizovaný mechanizmus formovania, vývoja a vyhľadávania Správa stavuŽiadny trvalý stavExplicitná údržba vyvíjajúceho sa stavu pamäte

Kľúčový rozdiel: Context Engineering je technika optimalizácie promptov, zatiaľ čo Agent Memory je systém správy stavu. Prvý sa zameriava na "Čo zadať teraz", druhý sa zameriava na "Čo si pamätám z minulosti a ako to ovplyvňuje súčasnosť a budúcnosť".

107-stranová štúdia RAG a Agent&LLM Memory

Technológie pamäte agenta

Agent Memory vs. RAG

Agent Memory vs. LLM Memory

Agent Memory vs. Context Engineering

You Might Also Like

Claude Code Buddy Úprava: Ako získať lesklého legendárneho domáceho maznáčika

Obsidian predstavil Defuddle, ktorý posunul Obsidian Web Clipper na novú úroveň

OpenAI náhle oznámila "trojv jednotě": sloučení prohlížeče + programování + ChatGPT, interně přiznává, že minulý rok šla špatnou cestou

2026, už sa viac nenúť "k disciplíne"! Urobte týchto 8 malých vecí a zdravie príde prirodzene

Tieto matky, ktoré sa snažia schudnúť, ale nedarí sa im, určite sa tu zasekli

AI Browser 24 hodinový stabilný prevádzkový sprievodca