Přehled 107 stran o RAG a paměti Agent&LLM
Dnes sdílím 107stránkový technický přehled od Renmin University, Fudan University, Peking University atd. s názvem „Memory in the Age of AI Agents: A Survey Forms, Functions and Dynamics“ (Paměť ve věku AI agentů: Průzkum forem, funkcí a dynamiky).
Adresa projektu: https://github.com/Shichun-Liu/Agent-Memory-Paper-List
Adresa článku: https://arxiv.org/pdf/2512.13564

V posledních dvou letech jsme byli svědky úžasného vývoje velkých jazykových modelů (LLM) směrem k AI agentům (AI Agents). Od Deep Research po softwarové inženýrství, od vědeckých objevů po spolupráci více agentů, tito agenti založení na základních modelech posouvají hranice umělé obecné inteligence (AGI).
Ale vyvstává zásadní otázka: Jak mohou mít agenti schopnost neustálého učení a adaptace, když statické parametry LLM nelze rychle aktualizovat?
Odpověď je – Paměť (Memory).
"Paměť je klíčovou schopností pro transformaci statických LLM na agenty, kteří se mohou neustále adaptovat prostřednictvím interakce s prostředím."

Figure 1 ukazuje jednotný klasifikační rámec navržený v článku, který organizuje paměť agenta podle tří dimenzí: Formy (Forms), Funkce (Functions) a Dynamika (Dynamics), a mapuje reprezentativní systémy do tohoto klasifikačního systému.

Článek také jasně rozlišuje Agent Memory od několika úzce souvisejících, ale zásadně odlišných konceptů: LLM Memory, Retrieval-Augmented Generation (RAG) a Context Engineering. Ačkoli všechny souvisejí s ukládáním a využíváním informací, existují klíčové rozdíly v cílech, mechanismech a aplikačních scénářích.
Technologie paměti agenta
-
Self-Evolving Memory: Memento, H2R
-
Multimodal Memory: Ella, ViloMem, M3-Agent
-
Latent Memory: MemoryLLM, M+, MemGen
-
Parametric Memory: Retroformer, Early experience
-
RL-enabled Memory: MemAgent, RMM, MemSearcher, MEM1, Mem-alpha, Memory-R1
Paměť agenta vs. RAG
RAG související technologie:
-
Modular RAG: FlashRAG, ComposeRAG
-
Graph RAG: LightRAG, HippoRAG
-
Agentic RAG: PlanRAG, Self-RAG
RAG a paměť agenta zahrnují načítání informací z externího úložiště pro zlepšení schopností modelu, ale existuje zásadní rozdíl ve filozofii designu:
FunkceRAGPaměť agenta Základní cílPoskytnout relevantní podpůrné informace pro aktuální dotazPodpora kontinuálního učení a adaptivního chování v průběhu času Zdroj informacíObvykle statická, předem vytvořená znalostní bázeDynamicky generované, personalizované informace z vlastní interakční zkušenosti agenta Spoušť načítáníPasivně spouštěno uživatelským dotazemAgent se aktivně rozhoduje, kdy a co načíst Aktualizace informacíZnalostní báze se obvykle aktualizuje offlineOnline, průběžná a selektivní aktualizace Zpětnovazební smyčkaŽádný přímý mechanismus zpětné vazbyVytváří uzavřenou smyčku s interakcí s prostředím
Klíčový rozdíl: RAG je nástroj pro rozšiřování znalostí, zatímco paměť agenta je učební mechanismus. RAG odpovídá na otázku „Co vím?“, zatímco paměť agenta odpovídá na otázku „Co jsem se naučil?“.
Paměť agenta vs. LLM paměť
LLM paměť související technologie:
-
Attention KV management: Mixture-of-Memory
-
Long context processing: Mamba, Memformer, MoA, Sparseformer, NSA
Dimenzepaměť LLMPaměť agenta DefiniceZnalosti internalizované v parametrech modelu nebo dočasné informace v kontextovém okněExterní systém, který podporuje kontinuální interakci agenta s prostředím, učení se mezi úkoly a dlouhodobou adaptaci Časové měřítkoOmezeno na předtréninková data nebo aktuální kontext dialoguPřekračuje více úkolů, konverzací a podporuje celoživotní učení AktualizovatelnostAktualizace parametrů je nákladná, kontextové informace jsou nestáléPodporuje efektivní, selektivní dynamické aktualizace a vývoj AktivitaPasivně reaguje na dotazyAktivně se rozhoduje, co ukládat, aktualizovat a načítat Vazba s prostředímŽádná přímá interakce s prostředímHluboká integrace zpětné vazby z prostředí, podpora interaktivního učení
Klíčový rozdíl: LLM paměť je v podstatě statická (parametry jsou pevné) nebo krátkodobá (kontext je omezený), zatímco paměť agenta je dynamická, trvalá a spojená s prostředím.
Paměť agenta vs. Kontextové inženýrství
Kontextové inženýrství související technologie:
-
Tool-integrated reasoning: ReTool, ToolLLM, Toolformer, VTool-R1, ToRL
-
Tool selection: AutoTool, VisTA
-
Communication protocol: ANP, A2A, MCP, Agora
Hlediskokontextové inženýrstvípaměť agenta ZaměřeníOptimalizace vstupu pro jedno kolo nebo aktuální úkolPerzistence a využití informací v průběhu více kol a úkolů Časová dimenzeAktuální konverzaceDlouhodobá historie Výběr informacíRučně navržená nebo heuristická pravidlaAutomatizované mechanismy pro formování, vývoj a načítání Správa stavuŽádný trvalý stavExplicitní údržba vyvíjejícího se stavu paměti
Klíčový rozdíl: Kontextové inženýrství je technika optimalizace promptů, zatímco paměť agenta je systém správy stavu. První se zaměřuje na „Co zadat nyní“, zatímco druhý se zaměřuje na „Co si pamatuji z minulosti a jak to ovlivňuje současnost a budoucnost“.





