En 107-siders oversikt over RAG og Agent & LLM-minne

I dag deler jeg en 107-siders teknisk oversikt fra Renmin University of China, Fudan University, Peking University, etc., med tittelen "Memory in the Age of AI Agents: A Survey Forms, Functions and Dynamics".

Prosjektadresse: https://github.com/Shichun-Liu/Agent-Memory-Paper-List

Artikkeladresse: https://arxiv.org/pdf/2512.13564

De siste to årene har vi vært vitne til den fantastiske utviklingen av store språkmodeller (LLM) til AI-agenter (AI Agents). Fra dyp forskning til programvareutvikling, fra vitenskapelige oppdagelser til multi-agent samarbeid, driver disse agentene basert på grunnleggende modeller grensene for kunstig generell intelligens (AGI).

Men et sentralt spørsmål dukker opp: Hvordan kan agenter ha kontinuerlig læring og tilpasningsevne når de statiske LLM-parametrene ikke kan oppdateres raskt?

Svaret er – minne (Memory).

"Minne er nøkkelen til å transformere statiske LLM-er til agenter som kontinuerlig kan tilpasse seg gjennom miljøinteraksjon."

Figur 1 viser det enhetlige klassifiseringsrammeverket som presenteres i artikkelen, som organiserer agentminne i henhold til tre dimensjoner: former (Forms), funksjoner (Functions) og dynamikk (Dynamics), og kartlegger representative systemer til dette klassifiseringssystemet.

Artikkelen skiller også tydelig mellom Agent Memory og flere nært beslektede, men vesentlig forskjellige konsepter: LLM-minne, Retrieval-Augmented Generation (RAG) og Context Engineering. Selv om de alle er relatert til lagring og bruk av informasjon, er det viktige forskjeller i mål, mekanismer og applikasjonsscenarier.

Agent Memory-teknologi

Self-Evolving Memory: Memento, H2R
Multimodal Memory: Ella, ViloMem, M3-Agent
Latent Memory: MemoryLLM, M+, MemGen
Parametric Memory: Retroformer, Early experience
RL-enabled Memory: MemAgent, RMM, MemSearcher, MEM1, Mem-alpha, Memory-R1

Agent Memory vs. RAG

RAG-relaterte teknologier:

Modular RAG: FlashRAG, ComposeRAG
Graph RAG: LightRAG, HippoRAG
Agentic RAG: PlanRAG, Self-RAG

RAG og agentminne involverer begge å hente informasjon fra ekstern lagring for å forbedre modellens evner, men det er en vesentlig forskjell i designfilosofi mellom de to:

FunksjonRAGAgentminne HovedmålGi relevant bakgrunnskunnskap for gjeldende spørringStøtte kontinuerlig læring og adaptiv atferd over tid InformasjonskildeVanligvis statiske, forhåndsbygde kunnskapsbaserDynamisk generert, personlig informasjon fra agentens egne interaksjonserfaringer Henting utløsesPassivt utløst av brukerspørringerAktivt bestemt av agenten når og hva som skal hentes InformasjonsoppdateringKunnskapsbasen oppdateres vanligvis offlineOnline, kontinuerlig og selektiv oppdatering TilbakemeldingssløyfeIngen direkte tilbakemeldingsmekanismeDanner en lukket sløyfe med miljøinteraksjon

Viktig forskjell: RAG er et kunnskapsutvidelsesverktøy, mens agentminne er en læringsmekanisme. RAG svarer på "Hva vet jeg", agentminne svarer på "Hva har jeg lært".

Agent Memory vs. LLM-minne

LLM-minne relatert teknologi:

Attention KV management: Mixture-of-Memory
Long context processing: Mamba, Memformer, MoA, Sparseformer, NSA

DimensjonLLM-minneAgentminne DefinisjonKunnskap internalisert i modellparametere, eller midlertidig informasjon i kontekstvinduetEksternt system som støtter agentens kontinuerlige interaksjon med miljøet, læring på tvers av oppgaver og langsiktig tilpasning TidsskalaBegrenset til forhåndstreningsdata eller gjeldende dialogkontekstSpenn over flere oppgaver, samtaler, støtter livslang læring OppdaterbarhetParametere er dyre å oppdatere, kontekstinformasjon er flyktigStøtter effektiv, selektiv dynamisk oppdatering og utvikling AktivitetPassivt svarer på spørringerAktivt bestemmer hva slags informasjon som skal lagres, oppdateres og hentes Kobling til miljøetIngen direkte interaksjon med miljøetDypt integrert med miljøtilbakemelding, støtter interaktiv læring

Viktig forskjell: LLM-minne er i hovedsak statisk (parametere er faste) eller kortvarig (konteksten er begrenset), mens agentminne er dynamisk, vedvarende og miljøkoblet.

Agent Memory vs. Context Engineering

Context Engineering relatert teknologi:

Tool-integrated reasoning: ReTool, ToolLLM, Toolformer, VTool-R1, ToRL
Tool selection: AutoTool, VisTA
Communication protocol: ANP, A2A, MCP, Agora

AspektContext EngineeringAgentminne FokusOptimalisering av input for en enkelt runde eller gjeldende oppgaveVedvarende og utnyttelse av informasjon over flere runder og oppgaver TidsdimensjonGjeldende samtaleLang historikk InformasjonsvalgManuell design eller heuristiske reglerAutomatisk dannelse, utvikling og hentingsmekanisme StatusadministrasjonIngen vedvarende statusEksplisitt vedlikehold av en utviklende minnestatus

Viktig forskjell: Context Engineering er en prompt-optimaliseringsteknikk, mens agentminne er et statusadministrasjonssystem. Førstnevnte fokuserer på "Hva skal jeg legge inn nå", sistnevnte fokuserer på "Hva husket jeg tidligere, og hvordan påvirker det nåtiden og fremtiden".

En 107-siders oversikt over RAG og Agent & LLM-minne

Agent Memory-teknologi

Agent Memory vs. RAG

Agent Memory vs. LLM-minne

Agent Memory vs. Context Engineering

You Might Also Like

Claude Code Buddy Modifikasjonsguide: Hvordan få glitrende legendariske kjæledyr

Obsidian har lansert Defuddle, og hevet Obsidian Web Clipper til nye høyder

OpenAI plutselig kunngjør "tre-i-ett": sammenslåing av nettleser + programmering + ChatGPT, internt innrømmer de at de har gått feil vei det siste året

2026, ikke tving deg selv til "selvdisiplin"! Gjør disse 8 små tingene, så kommer helsen naturlig

Mødre som sliter med å gå ned i vekt, er absolutt fanget her

AI Browser 24-timers stabil drift guide