107-sivuinen katsaus RAG:iin ja Agent&LLM-muistiin

Tänään jaan Renminin yliopiston, Fudanin yliopiston, Pekingin yliopiston jne. 107-sivuisen teknisen katsauksen "Memory in the Age of AI Agents: A Survey Forms, Functions and Dynamics".

Projektin osoite: https://github.com/Shichun-Liu/Agent-Memory-Paper-List

Tutkimuspaperin osoite: https://arxiv.org/pdf/2512.13564

Viimeisten kahden vuoden aikana olemme nähneet suurten kielimallien (LLM) hämmästyttävän kehityksen kohti tekoälyagentteja (AI Agents). Deep Researchista ohjelmistotuotantoon, tieteellisistä löydöksistä moniagenttiyhteistyöhön, nämä perusmalleihin perustuvat agentit työntävät eteenpäin yleisen tekoälyn (AGI) rajoja.

Mutta yksi keskeinen kysymys nousee esiin: Kuinka agentit voivat oppia ja sopeutua jatkuvasti, kun staattisia LLM-parametreja ei voida päivittää nopeasti?

Vastaus on – muisti (Memory).

"Muisti on avainasemassa muuttaessa staattiset LLM:t agenteiksi, jotka pystyvät jatkuvasti sopeutumaan ympäristön vuorovaikutuksen kautta."

Figure 1 esittää tutkimuspaperissa ehdotetun yhtenäisen luokittelukehyksen, joka järjestää agenttimuistin kolmen ulottuvuuden mukaan: muodot (Forms), toiminnot (Functions) ja dynamiikka (Dynamics), ja kartoittaa edustavat järjestelmät tähän luokittelujärjestelmään.

Tutkimuspaperi erottaa myös selkeästi agenttimuistin useista läheisesti liittyvistä, mutta olennaisesti erilaisista käsitteistä: LLM-muisti, hakuun perustuva generointi (RAG) ja kontekstisuunnittelu. Vaikka ne kaikki liittyvät tiedon tallentamiseen ja hyödyntämiseen, niiden tavoitteissa, mekanismeissa ja sovellusskenaarioissa on keskeisiä eroja.

Agenttimuistitekniikat

Self-Evolving Memory: Memento, H2R
Multimodal Memory: Ella, ViloMem, M3-Agent
Latent Memory: MemoryLLM, M+, MemGen
Parametric Memory: Retroformer, Early experience
RL-enabled Memory: MemAgent, RMM, MemSearcher, MEM1, Mem-alpha, Memory-R1

Agenttimuisti vs. RAG

RAG-liittyvät tekniikat:

Modular RAG: FlashRAG, ComposeRAG
Graph RAG: LightRAG, HippoRAG
Agentic RAG: PlanRAG, Self-RAG

RAG ja agenttimuisti molemmat sisältävät tiedon hakemisen ulkoisesta tallennustilasta mallin kykyjen parantamiseksi, mutta niiden suunnittelufilosofioissa on olennainen ero:

OminaisuusRAGAgenttimuisti Keskeinen tavoiteTarjota asiaankuuluvaa taustatietoa nykyiselle kyselylleTukea jatkuvaa oppimista ja mukautuvaa käyttäytymistä ajan mittaan Tiedon lähdeYleensä staattinen, ennalta rakennettu tietokantaDynaamisesti luotu, peräisin agentin omasta vuorovaikutuskokemuksesta Haun käynnistysKäynnistetään passiivisesti käyttäjän kyselylläAgentti päättää aktiivisesti milloin ja mitä hakea Tiedon päivitysTietokanta päivitetään yleensä offline-tilassaPäivitetään online-tilassa, jatkuvasti ja valikoivasti PalautesilmukkaEi suoraa palautemekanismiaMuodostaa suljetun silmukan ympäristön vuorovaikutuksen kanssa

Keskeinen ero: RAG on tiedon laajennustyökalu, kun taas agenttimuisti on oppimismekanismi. RAG vastaa "Mitä tiedän", agenttimuisti vastaa "Mitä olen oppinut".

Agenttimuisti vs. LLM-muisti

LLM-muistiin liittyvät tekniikat:

Attention KV management: Mixture-of-Memory
Long context processing: Mamba, Memformer, MoA, Sparseformer, NSA

UlottuvuusLLM-muistiAgenttimuisti MääritelmäMallin parametreihin sisällytetty tieto tai väliaikainen tieto konteksti-ikkunassaUlkoinen järjestelmä, joka tukee agentin jatkuvaa vuorovaikutusta ympäristön kanssa, tehtävien välistä oppimista ja pitkäaikaista sopeutumista AikaskaalaRajoittuu esikoulutustietoihin tai nykyiseen keskustelukontekstiinUlottuu useisiin tehtäviin ja istuntoihin, tukee elinikäistä oppimista PäivitettävyysParametrien päivityskustannukset ovat korkeat, kontekstitiedot ovat haihtuviaTukee tehokasta, valikoivaa dynaamista päivitystä ja kehitystä AktiivisuusReagoi passiivisesti kyselyihinPäättää aktiivisesti, mitä tietoja tallentaa, päivittää ja hakea Ympäristön kytkentäEi suoraa vuorovaikutusta ympäristön kanssaIntegroituu syvästi ympäristöpalautteeseen, tukee interaktiivista oppimista

Keskeinen ero: LLM-muisti on pohjimmiltaan staattinen (parametrit kiinteät) tai lyhytkestoinen (konteksti rajoitettu), kun taas agenttimuisti on dynaaminen, pysyvä ja ympäristöön kytketty.

Agenttimuisti vs. Kontekstisuunnittelu

Kontekstisuunnitteluun liittyvät tekniikat:

Tool-integrated reasoning: ReTool, ToolLLM, Toolformer, VTool-R1, ToRL
Tool selection: AutoTool, VisTA
Communication protocol: ANP, A2A, MCP, Agora

NäkökulmaKontekstisuunnitteluAgenttimuisti KohdeYksittäisen kierroksen tai nykyisen tehtävän syötteen optimointiTiedon pysyvyys ja hyödyntäminen useiden kierrosten ja tehtävien välillä AikaulottuvuusNykyinen istuntoPitkäaikainen historia Tiedon valintaIhmisen suunnittelemat tai heuristiset säännötAutomatisoitu muodostus-, kehitys- ja hakumekanismi TilanhallintaEi pysyvää tilaaYlläpitää eksplisiittisesti kehitettävää muistitilaa

Keskeinen ero: Kontekstisuunnittelu on kehotteiden optimointitekniikka, kun taas agenttimuisti on tilanhallintajärjestelmä. Edellinen keskittyy "Mitä syötetään nyt", jälkimmäinen keskittyy "Mitä on muistettu aiemmin, miten se vaikuttaa nykyisyyteen ja tulevaisuuteen".

107-sivuinen katsaus RAG:iin ja Agent&LLM-muistiin

Agenttimuistitekniikat

Agenttimuisti vs. RAG

Agenttimuisti vs. LLM-muisti

Agenttimuisti vs. Kontekstisuunnittelu

You Might Also Like

Claude Code Buddy 修改指南：如何获得闪光传说级宠物

Obsidian julkaisi Defuddlen, joka vie Obsidian Web Clipperin uudelle tasolle

OpenAI yllättäen ilmoittaa "kolme yhdessä": selain + ohjelmointi + ChatGPT yhdistyvät, sisäisesti myönnetään, että viime vuosi meni pieleen

2026, älä pakota itseäsi 'itsekuriksi'! Tee nämä 8 pientä asiaa, terveys tulee luonnostaan

Ne äidit, jotka yrittävät laihtua mutta eivät onnistu, kompastuvat varmasti tähän

AI Browser 24小时稳定运行指南