En 107-siders oversikt over RAG og Agent & LLM-minne

2/15/2026
3 min read

I dag deler jeg en 107-siders teknisk oversikt fra Renmin University of China, Fudan University, Peking University, etc., med tittelen "Memory in the Age of AI Agents: A Survey Forms, Functions and Dynamics".

Prosjektadresse: https://github.com/Shichun-Liu/Agent-Memory-Paper-List

Artikkeladresse: https://arxiv.org/pdf/2512.13564

De siste to årene har vi vært vitne til den fantastiske utviklingen av store språkmodeller (LLM) til AI-agenter (AI Agents). Fra dyp forskning til programvareutvikling, fra vitenskapelige oppdagelser til multi-agent samarbeid, driver disse agentene basert på grunnleggende modeller grensene for kunstig generell intelligens (AGI).

Men et sentralt spørsmål dukker opp: Hvordan kan agenter ha kontinuerlig læring og tilpasningsevne når de statiske LLM-parametrene ikke kan oppdateres raskt?

Svaret er – minne (Memory).

"Minne er nøkkelen til å transformere statiske LLM-er til agenter som kontinuerlig kan tilpasse seg gjennom miljøinteraksjon."

Figur 1 viser det enhetlige klassifiseringsrammeverket som presenteres i artikkelen, som organiserer agentminne i henhold til tre dimensjoner: former (Forms), funksjoner (Functions) og dynamikk (Dynamics), og kartlegger representative systemer til dette klassifiseringssystemet.

Artikkelen skiller også tydelig mellom Agent Memory og flere nært beslektede, men vesentlig forskjellige konsepter: LLM-minne, Retrieval-Augmented Generation (RAG) og Context Engineering. Selv om de alle er relatert til lagring og bruk av informasjon, er det viktige forskjeller i mål, mekanismer og applikasjonsscenarier.

Agent Memory-teknologi

  • Self-Evolving Memory: Memento, H2R

  • Multimodal Memory: Ella, ViloMem, M3-Agent

  • Latent Memory: MemoryLLM, M+, MemGen

  • Parametric Memory: Retroformer, Early experience

  • RL-enabled Memory: MemAgent, RMM, MemSearcher, MEM1, Mem-alpha, Memory-R1

Agent Memory vs. RAG

RAG-relaterte teknologier:

  • Modular RAG: FlashRAG, ComposeRAG

  • Graph RAG: LightRAG, HippoRAG

  • Agentic RAG: PlanRAG, Self-RAG

RAG og agentminne involverer begge å hente informasjon fra ekstern lagring for å forbedre modellens evner, men det er en vesentlig forskjell i designfilosofi mellom de to:

FunksjonRAGAgentminne HovedmålGi relevant bakgrunnskunnskap for gjeldende spørringStøtte kontinuerlig læring og adaptiv atferd over tid InformasjonskildeVanligvis statiske, forhåndsbygde kunnskapsbaserDynamisk generert, personlig informasjon fra agentens egne interaksjonserfaringer Henting utløsesPassivt utløst av brukerspørringerAktivt bestemt av agenten når og hva som skal hentes InformasjonsoppdateringKunnskapsbasen oppdateres vanligvis offlineOnline, kontinuerlig og selektiv oppdatering TilbakemeldingssløyfeIngen direkte tilbakemeldingsmekanismeDanner en lukket sløyfe med miljøinteraksjon

Viktig forskjell: RAG er et kunnskapsutvidelsesverktøy, mens agentminne er en læringsmekanisme. RAG svarer på "Hva vet jeg", agentminne svarer på "Hva har jeg lært".

Agent Memory vs. LLM-minne

LLM-minne relatert teknologi:

  • Attention KV management: Mixture-of-Memory

  • Long context processing: Mamba, Memformer, MoA, Sparseformer, NSA

DimensjonLLM-minneAgentminne DefinisjonKunnskap internalisert i modellparametere, eller midlertidig informasjon i kontekstvinduetEksternt system som støtter agentens kontinuerlige interaksjon med miljøet, læring på tvers av oppgaver og langsiktig tilpasning TidsskalaBegrenset til forhåndstreningsdata eller gjeldende dialogkontekstSpenn over flere oppgaver, samtaler, støtter livslang læring OppdaterbarhetParametere er dyre å oppdatere, kontekstinformasjon er flyktigStøtter effektiv, selektiv dynamisk oppdatering og utvikling AktivitetPassivt svarer på spørringerAktivt bestemmer hva slags informasjon som skal lagres, oppdateres og hentes Kobling til miljøetIngen direkte interaksjon med miljøetDypt integrert med miljøtilbakemelding, støtter interaktiv læring

Viktig forskjell: LLM-minne er i hovedsak statisk (parametere er faste) eller kortvarig (konteksten er begrenset), mens agentminne er dynamisk, vedvarende og miljøkoblet.

Agent Memory vs. Context Engineering

Context Engineering relatert teknologi:

  • Tool-integrated reasoning: ReTool, ToolLLM, Toolformer, VTool-R1, ToRL

  • Tool selection: AutoTool, VisTA

  • Communication protocol: ANP, A2A, MCP, Agora

AspektContext EngineeringAgentminne FokusOptimalisering av input for en enkelt runde eller gjeldende oppgaveVedvarende og utnyttelse av informasjon over flere runder og oppgaver TidsdimensjonGjeldende samtaleLang historikk InformasjonsvalgManuell design eller heuristiske reglerAutomatisk dannelse, utvikling og hentingsmekanisme StatusadministrasjonIngen vedvarende statusEksplisitt vedlikehold av en utviklende minnestatus

Viktig forskjell: Context Engineering er en prompt-optimaliseringsteknikk, mens agentminne er et statusadministrasjonssystem. Førstnevnte fokuserer på "Hva skal jeg legge inn nå", sistnevnte fokuserer på "Hva husket jeg tidligere, og hvordan påvirker det nåtiden og fremtiden".

Published in Technology

You Might Also Like