Přehled 107 stran o RAG a paměti Agent&LLM

2/15/2026
4 min read

Dnes sdílím 107stránkový technický přehled od Renmin University, Fudan University, Peking University atd. s názvem „Memory in the Age of AI Agents: A Survey Forms, Functions and Dynamics“ (Paměť ve věku AI agentů: Průzkum forem, funkcí a dynamiky).

Adresa projektu: https://github.com/Shichun-Liu/Agent-Memory-Paper-List

Adresa článku: https://arxiv.org/pdf/2512.13564

V posledních dvou letech jsme byli svědky úžasného vývoje velkých jazykových modelů (LLM) směrem k AI agentům (AI Agents). Od Deep Research po softwarové inženýrství, od vědeckých objevů po spolupráci více agentů, tito agenti založení na základních modelech posouvají hranice umělé obecné inteligence (AGI).

Ale vyvstává zásadní otázka: Jak mohou mít agenti schopnost neustálého učení a adaptace, když statické parametry LLM nelze rychle aktualizovat?

Odpověď je – Paměť (Memory).

"Paměť je klíčovou schopností pro transformaci statických LLM na agenty, kteří se mohou neustále adaptovat prostřednictvím interakce s prostředím."

Figure 1 ukazuje jednotný klasifikační rámec navržený v článku, který organizuje paměť agenta podle tří dimenzí: Formy (Forms), Funkce (Functions) a Dynamika (Dynamics), a mapuje reprezentativní systémy do tohoto klasifikačního systému.

Článek také jasně rozlišuje Agent Memory od několika úzce souvisejících, ale zásadně odlišných konceptů: LLM Memory, Retrieval-Augmented Generation (RAG) a Context Engineering. Ačkoli všechny souvisejí s ukládáním a využíváním informací, existují klíčové rozdíly v cílech, mechanismech a aplikačních scénářích.

Technologie paměti agenta

  • Self-Evolving Memory: Memento, H2R

  • Multimodal Memory: Ella, ViloMem, M3-Agent

  • Latent Memory: MemoryLLM, M+, MemGen

  • Parametric Memory: Retroformer, Early experience

  • RL-enabled Memory: MemAgent, RMM, MemSearcher, MEM1, Mem-alpha, Memory-R1

Paměť agenta vs. RAG

RAG související technologie:

  • Modular RAG: FlashRAG, ComposeRAG

  • Graph RAG: LightRAG, HippoRAG

  • Agentic RAG: PlanRAG, Self-RAG

RAG a paměť agenta zahrnují načítání informací z externího úložiště pro zlepšení schopností modelu, ale existuje zásadní rozdíl ve filozofii designu:

FunkceRAGPaměť agenta Základní cílPoskytnout relevantní podpůrné informace pro aktuální dotazPodpora kontinuálního učení a adaptivního chování v průběhu času Zdroj informacíObvykle statická, předem vytvořená znalostní bázeDynamicky generované, personalizované informace z vlastní interakční zkušenosti agenta Spoušť načítáníPasivně spouštěno uživatelským dotazemAgent se aktivně rozhoduje, kdy a co načíst Aktualizace informacíZnalostní báze se obvykle aktualizuje offlineOnline, průběžná a selektivní aktualizace Zpětnovazební smyčkaŽádný přímý mechanismus zpětné vazbyVytváří uzavřenou smyčku s interakcí s prostředím

Klíčový rozdíl: RAG je nástroj pro rozšiřování znalostí, zatímco paměť agenta je učební mechanismus. RAG odpovídá na otázku „Co vím?“, zatímco paměť agenta odpovídá na otázku „Co jsem se naučil?“.

Paměť agenta vs. LLM paměť

LLM paměť související technologie:

  • Attention KV management: Mixture-of-Memory

  • Long context processing: Mamba, Memformer, MoA, Sparseformer, NSA

Dimenzepaměť LLMPaměť agenta DefiniceZnalosti internalizované v parametrech modelu nebo dočasné informace v kontextovém okněExterní systém, který podporuje kontinuální interakci agenta s prostředím, učení se mezi úkoly a dlouhodobou adaptaci Časové měřítkoOmezeno na předtréninková data nebo aktuální kontext dialoguPřekračuje více úkolů, konverzací a podporuje celoživotní učení AktualizovatelnostAktualizace parametrů je nákladná, kontextové informace jsou nestáléPodporuje efektivní, selektivní dynamické aktualizace a vývoj AktivitaPasivně reaguje na dotazyAktivně se rozhoduje, co ukládat, aktualizovat a načítat Vazba s prostředímŽádná přímá interakce s prostředímHluboká integrace zpětné vazby z prostředí, podpora interaktivního učení

Klíčový rozdíl: LLM paměť je v podstatě statická (parametry jsou pevné) nebo krátkodobá (kontext je omezený), zatímco paměť agenta je dynamická, trvalá a spojená s prostředím.

Paměť agenta vs. Kontextové inženýrství

Kontextové inženýrství související technologie:

  • Tool-integrated reasoning: ReTool, ToolLLM, Toolformer, VTool-R1, ToRL

  • Tool selection: AutoTool, VisTA

  • Communication protocol: ANP, A2A, MCP, Agora

Hlediskokontextové inženýrstvípaměť agenta ZaměřeníOptimalizace vstupu pro jedno kolo nebo aktuální úkolPerzistence a využití informací v průběhu více kol a úkolů Časová dimenzeAktuální konverzaceDlouhodobá historie Výběr informacíRučně navržená nebo heuristická pravidlaAutomatizované mechanismy pro formování, vývoj a načítání Správa stavuŽádný trvalý stavExplicitní údržba vyvíjejícího se stavu paměti

Klíčový rozdíl: Kontextové inženýrství je technika optimalizace promptů, zatímco paměť agenta je systém správy stavu. První se zaměřuje na „Co zadat nyní“, zatímco druhý se zaměřuje na „Co si pamatuji z minulosti a jak to ovlivňuje současnost a budoucnost“.

Published in Technology

You Might Also Like

Jak používat technologie cloud computingu: Kompletní průvodce pro vytvoření vaší první cloudové infrastrukturyTechnology

Jak používat technologie cloud computingu: Kompletní průvodce pro vytvoření vaší první cloudové infrastruktury

Jak používat technologie cloud computingu: Kompletní průvodce pro vytvoření vaší první cloudové infrastruktury Úvod S ur...

Varování! Otec Claude Code říká: Za měsíc bez režimu plánování zmizí titul softwarového inženýraTechnology

Varování! Otec Claude Code říká: Za měsíc bez režimu plánování zmizí titul softwarového inženýra

Varování! Otec Claude Code říká: Za měsíc bez režimu plánování zmizí titul softwarového inženýra Nedávno se v technolog...

2026年 Top 10 深度学习资源推荐Technology

2026年 Top 10 深度学习资源推荐

2026年 Top 10 深度学习资源推荐 随着深度学习在各个领域的迅速发展,越来越多的学习资源和工具涌现出来。本文将为您推荐2026年最值得关注的十个深度学习资源,帮助您在这一领域中快速成长。 1. Coursera Deep Learn...

Top 10 AI agentů v roce 2026: Analýza klíčových prodejních bodůTechnology

Top 10 AI agentů v roce 2026: Analýza klíčových prodejních bodů

Top 10 AI agentů v roce 2026: Analýza klíčových prodejních bodů Úvod S rychlým rozvojem umělé inteligence se AI agenti (...

Doporučení 10 nejlepších AI nástrojů pro rok 2026: Uvolnění skutečného potenciálu umělé inteligenceTechnology

Doporučení 10 nejlepších AI nástrojů pro rok 2026: Uvolnění skutečného potenciálu umělé inteligence

Doporučení 10 nejlepších AI nástrojů pro rok 2026: Uvolnění skutečného potenciálu umělé inteligence V dnešní době rychlé...

2026年 Top 10 AWS工具和资源推荐Technology

2026年 Top 10 AWS工具和资源推荐

2026年 Top 10 AWS工具和资源推荐 V rychle se rozvíjející oblasti cloud computingu je Amazon Web Services (AWS) lídrem, který nabí...