Přehled 107 stran o RAG a paměti Agent&LLM

Dnes sdílím 107stránkový technický přehled od Renmin University, Fudan University, Peking University atd. s názvem „Memory in the Age of AI Agents: A Survey Forms, Functions and Dynamics“ (Paměť ve věku AI agentů: Průzkum forem, funkcí a dynamiky).

Adresa projektu: https://github.com/Shichun-Liu/Agent-Memory-Paper-List

Adresa článku: https://arxiv.org/pdf/2512.13564

V posledních dvou letech jsme byli svědky úžasného vývoje velkých jazykových modelů (LLM) směrem k AI agentům (AI Agents). Od Deep Research po softwarové inženýrství, od vědeckých objevů po spolupráci více agentů, tito agenti založení na základních modelech posouvají hranice umělé obecné inteligence (AGI).

Ale vyvstává zásadní otázka: Jak mohou mít agenti schopnost neustálého učení a adaptace, když statické parametry LLM nelze rychle aktualizovat?

Odpověď je – Paměť (Memory).

"Paměť je klíčovou schopností pro transformaci statických LLM na agenty, kteří se mohou neustále adaptovat prostřednictvím interakce s prostředím."

Figure 1 ukazuje jednotný klasifikační rámec navržený v článku, který organizuje paměť agenta podle tří dimenzí: Formy (Forms), Funkce (Functions) a Dynamika (Dynamics), a mapuje reprezentativní systémy do tohoto klasifikačního systému.

Článek také jasně rozlišuje Agent Memory od několika úzce souvisejících, ale zásadně odlišných konceptů: LLM Memory, Retrieval-Augmented Generation (RAG) a Context Engineering. Ačkoli všechny souvisejí s ukládáním a využíváním informací, existují klíčové rozdíly v cílech, mechanismech a aplikačních scénářích.

Technologie paměti agenta

Self-Evolving Memory: Memento, H2R
Multimodal Memory: Ella, ViloMem, M3-Agent
Latent Memory: MemoryLLM, M+, MemGen
Parametric Memory: Retroformer, Early experience
RL-enabled Memory: MemAgent, RMM, MemSearcher, MEM1, Mem-alpha, Memory-R1

Paměť agenta vs. RAG

RAG související technologie:

Modular RAG: FlashRAG, ComposeRAG
Graph RAG: LightRAG, HippoRAG
Agentic RAG: PlanRAG, Self-RAG

RAG a paměť agenta zahrnují načítání informací z externího úložiště pro zlepšení schopností modelu, ale existuje zásadní rozdíl ve filozofii designu:

FunkceRAGPaměť agenta Základní cílPoskytnout relevantní podpůrné informace pro aktuální dotazPodpora kontinuálního učení a adaptivního chování v průběhu času Zdroj informacíObvykle statická, předem vytvořená znalostní bázeDynamicky generované, personalizované informace z vlastní interakční zkušenosti agenta Spoušť načítáníPasivně spouštěno uživatelským dotazemAgent se aktivně rozhoduje, kdy a co načíst Aktualizace informacíZnalostní báze se obvykle aktualizuje offlineOnline, průběžná a selektivní aktualizace Zpětnovazební smyčkaŽádný přímý mechanismus zpětné vazbyVytváří uzavřenou smyčku s interakcí s prostředím

Klíčový rozdíl: RAG je nástroj pro rozšiřování znalostí, zatímco paměť agenta je učební mechanismus. RAG odpovídá na otázku „Co vím?“, zatímco paměť agenta odpovídá na otázku „Co jsem se naučil?“.

Paměť agenta vs. LLM paměť

LLM paměť související technologie:

Attention KV management: Mixture-of-Memory
Long context processing: Mamba, Memformer, MoA, Sparseformer, NSA

Dimenzepaměť LLMPaměť agenta DefiniceZnalosti internalizované v parametrech modelu nebo dočasné informace v kontextovém okněExterní systém, který podporuje kontinuální interakci agenta s prostředím, učení se mezi úkoly a dlouhodobou adaptaci Časové měřítkoOmezeno na předtréninková data nebo aktuální kontext dialoguPřekračuje více úkolů, konverzací a podporuje celoživotní učení AktualizovatelnostAktualizace parametrů je nákladná, kontextové informace jsou nestáléPodporuje efektivní, selektivní dynamické aktualizace a vývoj AktivitaPasivně reaguje na dotazyAktivně se rozhoduje, co ukládat, aktualizovat a načítat Vazba s prostředímŽádná přímá interakce s prostředímHluboká integrace zpětné vazby z prostředí, podpora interaktivního učení

Klíčový rozdíl: LLM paměť je v podstatě statická (parametry jsou pevné) nebo krátkodobá (kontext je omezený), zatímco paměť agenta je dynamická, trvalá a spojená s prostředím.

Paměť agenta vs. Kontextové inženýrství

Kontextové inženýrství související technologie:

Tool-integrated reasoning: ReTool, ToolLLM, Toolformer, VTool-R1, ToRL
Tool selection: AutoTool, VisTA
Communication protocol: ANP, A2A, MCP, Agora

Hlediskokontextové inženýrstvípaměť agenta ZaměřeníOptimalizace vstupu pro jedno kolo nebo aktuální úkolPerzistence a využití informací v průběhu více kol a úkolů Časová dimenzeAktuální konverzaceDlouhodobá historie Výběr informacíRučně navržená nebo heuristická pravidlaAutomatizované mechanismy pro formování, vývoj a načítání Správa stavuŽádný trvalý stavExplicitní údržba vyvíjejícího se stavu paměti

Klíčový rozdíl: Kontextové inženýrství je technika optimalizace promptů, zatímco paměť agenta je systém správy stavu. První se zaměřuje na „Co zadat nyní“, zatímco druhý se zaměřuje na „Co si pamatuji z minulosti a jak to ovlivňuje současnost a budoucnost“.

Přehled 107 stran o RAG a paměti Agent&LLM

Technologie paměti agenta

Paměť agenta vs. RAG

Paměť agenta vs. LLM paměť

Paměť agenta vs. Kontextové inženýrství

You Might Also Like

Claude Code Buddy úpravy: Jak získat lesklého legendárního mazlíčka

Obsidian uvedl Defuddle, který posunul Obsidian Web Clipper na novou úroveň

OpenAI náhle oznámila "třív jednom": sloučení prohlížeče + programování + ChatGPT, interně přiznává, že se v uplynulém roce mýlila

2026, už se nenuťte k "sebeovládání"! Udělejte těchto 8 drobností a zdraví přijde přirozeně

Ty matky, které se snaží zhubnout, ale nedaří se jim, se určitě potýkají s tímto problémem

AI Browser 24 hodinový stabilní provozní průvodce