107-sivuinen katsaus RAG:iin ja Agent&LLM-muistiin

2/15/2026
3 min read

Tänään jaan Renminin yliopiston, Fudanin yliopiston, Pekingin yliopiston jne. 107-sivuisen teknisen katsauksen "Memory in the Age of AI Agents: A Survey Forms, Functions and Dynamics".

Projektin osoite: https://github.com/Shichun-Liu/Agent-Memory-Paper-List

Tutkimuspaperin osoite: https://arxiv.org/pdf/2512.13564

Viimeisten kahden vuoden aikana olemme nähneet suurten kielimallien (LLM) hämmästyttävän kehityksen kohti tekoälyagentteja (AI Agents). Deep Researchista ohjelmistotuotantoon, tieteellisistä löydöksistä moniagenttiyhteistyöhön, nämä perusmalleihin perustuvat agentit työntävät eteenpäin yleisen tekoälyn (AGI) rajoja.

Mutta yksi keskeinen kysymys nousee esiin: Kuinka agentit voivat oppia ja sopeutua jatkuvasti, kun staattisia LLM-parametreja ei voida päivittää nopeasti?

Vastaus on – muisti (Memory).

"Muisti on avainasemassa muuttaessa staattiset LLM:t agenteiksi, jotka pystyvät jatkuvasti sopeutumaan ympäristön vuorovaikutuksen kautta."

Figure 1 esittää tutkimuspaperissa ehdotetun yhtenäisen luokittelukehyksen, joka järjestää agenttimuistin kolmen ulottuvuuden mukaan: muodot (Forms), toiminnot (Functions) ja dynamiikka (Dynamics), ja kartoittaa edustavat järjestelmät tähän luokittelujärjestelmään.

Tutkimuspaperi erottaa myös selkeästi agenttimuistin useista läheisesti liittyvistä, mutta olennaisesti erilaisista käsitteistä: LLM-muisti, hakuun perustuva generointi (RAG) ja kontekstisuunnittelu. Vaikka ne kaikki liittyvät tiedon tallentamiseen ja hyödyntämiseen, niiden tavoitteissa, mekanismeissa ja sovellusskenaarioissa on keskeisiä eroja.

Agenttimuistitekniikat

  • Self-Evolving Memory: Memento, H2R

  • Multimodal Memory: Ella, ViloMem, M3-Agent

  • Latent Memory: MemoryLLM, M+, MemGen

  • Parametric Memory: Retroformer, Early experience

  • RL-enabled Memory: MemAgent, RMM, MemSearcher, MEM1, Mem-alpha, Memory-R1

Agenttimuisti vs. RAG

RAG-liittyvät tekniikat:

  • Modular RAG: FlashRAG, ComposeRAG

  • Graph RAG: LightRAG, HippoRAG

  • Agentic RAG: PlanRAG, Self-RAG

RAG ja agenttimuisti molemmat sisältävät tiedon hakemisen ulkoisesta tallennustilasta mallin kykyjen parantamiseksi, mutta niiden suunnittelufilosofioissa on olennainen ero:

OminaisuusRAGAgenttimuisti Keskeinen tavoiteTarjota asiaankuuluvaa taustatietoa nykyiselle kyselylleTukea jatkuvaa oppimista ja mukautuvaa käyttäytymistä ajan mittaan Tiedon lähdeYleensä staattinen, ennalta rakennettu tietokantaDynaamisesti luotu, peräisin agentin omasta vuorovaikutuskokemuksesta Haun käynnistysKäynnistetään passiivisesti käyttäjän kyselylläAgentti päättää aktiivisesti milloin ja mitä hakea Tiedon päivitysTietokanta päivitetään yleensä offline-tilassaPäivitetään online-tilassa, jatkuvasti ja valikoivasti PalautesilmukkaEi suoraa palautemekanismiaMuodostaa suljetun silmukan ympäristön vuorovaikutuksen kanssa

Keskeinen ero: RAG on tiedon laajennustyökalu, kun taas agenttimuisti on oppimismekanismi. RAG vastaa "Mitä tiedän", agenttimuisti vastaa "Mitä olen oppinut".

Agenttimuisti vs. LLM-muisti

LLM-muistiin liittyvät tekniikat:

  • Attention KV management: Mixture-of-Memory

  • Long context processing: Mamba, Memformer, MoA, Sparseformer, NSA

UlottuvuusLLM-muistiAgenttimuisti MääritelmäMallin parametreihin sisällytetty tieto tai väliaikainen tieto konteksti-ikkunassaUlkoinen järjestelmä, joka tukee agentin jatkuvaa vuorovaikutusta ympäristön kanssa, tehtävien välistä oppimista ja pitkäaikaista sopeutumista AikaskaalaRajoittuu esikoulutustietoihin tai nykyiseen keskustelukontekstiinUlottuu useisiin tehtäviin ja istuntoihin, tukee elinikäistä oppimista PäivitettävyysParametrien päivityskustannukset ovat korkeat, kontekstitiedot ovat haihtuviaTukee tehokasta, valikoivaa dynaamista päivitystä ja kehitystä AktiivisuusReagoi passiivisesti kyselyihinPäättää aktiivisesti, mitä tietoja tallentaa, päivittää ja hakea Ympäristön kytkentäEi suoraa vuorovaikutusta ympäristön kanssaIntegroituu syvästi ympäristöpalautteeseen, tukee interaktiivista oppimista

Keskeinen ero: LLM-muisti on pohjimmiltaan staattinen (parametrit kiinteät) tai lyhytkestoinen (konteksti rajoitettu), kun taas agenttimuisti on dynaaminen, pysyvä ja ympäristöön kytketty.

Agenttimuisti vs. Kontekstisuunnittelu

Kontekstisuunnitteluun liittyvät tekniikat:

  • Tool-integrated reasoning: ReTool, ToolLLM, Toolformer, VTool-R1, ToRL

  • Tool selection: AutoTool, VisTA

  • Communication protocol: ANP, A2A, MCP, Agora

NäkökulmaKontekstisuunnitteluAgenttimuisti KohdeYksittäisen kierroksen tai nykyisen tehtävän syötteen optimointiTiedon pysyvyys ja hyödyntäminen useiden kierrosten ja tehtävien välillä AikaulottuvuusNykyinen istuntoPitkäaikainen historia Tiedon valintaIhmisen suunnittelemat tai heuristiset säännötAutomatisoitu muodostus-, kehitys- ja hakumekanismi TilanhallintaEi pysyvää tilaaYlläpitää eksplisiittisesti kehitettävää muistitilaa

Keskeinen ero: Kontekstisuunnittelu on kehotteiden optimointitekniikka, kun taas agenttimuisti on tilanhallintajärjestelmä. Edellinen keskittyy "Mitä syötetään nyt", jälkimmäinen keskittyy "Mitä on muistettu aiemmin, miten se vaikuttaa nykyisyyteen ja tulevaisuuteen".

Published in Technology

You Might Also Like

Kuinka käyttää pilvilaskentateknologiaa: Rakenna ensimmäinen pilvi-infrastruktuurisi täydellinen opasTechnology

Kuinka käyttää pilvilaskentateknologiaa: Rakenna ensimmäinen pilvi-infrastruktuurisi täydellinen opas

[[HTMLPLACEHOLDER0]] [[HTMLPLACEHOLDER1]] [[HTMLPLACEHOLDER2]] [[HTMLPLACEHOLDER3]] [[HTMLPLACEHOLDER4]] [[HTMLPLACEHOLD...

Varoitus! Claude Code isänsä Boris Cherny sanoo: Kuukauden kuluttua Plan Modea ei enää käytetä, ohjelmistosuunnittelijan titteli katoaaTechnology

Varoitus! Claude Code isänsä Boris Cherny sanoo: Kuukauden kuluttua Plan Modea ei enää käytetä, ohjelmistosuunnittelijan titteli katoaa

Varoitus! Claude Code isänsä Boris Cherny sanoo: Kuukauden kuluttua Plan Modea ei enää käytetä, ohjelmistosuunnittelijan...

2026年 Top 10 深度学习资源推荐Technology

2026年 Top 10 深度学习资源推荐

2026年 Top 10 深度学习资源推荐 随着深度学习在各个领域的迅速发展,越来越多的学习资源和工具涌现出来。本文将为您推荐2026年最值得关注的十个深度学习资源,帮助您在这一领域中快速成长。 1. Coursera Deep Learn...

2026 Top 10 AI Agentit: Ydinmyyntipisteiden analyysiTechnology

2026 Top 10 AI Agentit: Ydinmyyntipisteiden analyysi

2026 Top 10 AI Agentit: Ydinmyyntipisteiden analyysi Johdanto Nopean tekoälyn kehityksen myötä AI agentit ovat nousseet ...

2026 vuoden Top 10 AI-työkalusuositukset: Vapauta tekoälyn todellinen potentiaaliTechnology

2026 vuoden Top 10 AI-työkalusuositukset: Vapauta tekoälyn todellinen potentiaali

2026 vuoden Top 10 AI-työkalusuositukset: Vapauta tekoälyn todellinen potentiaali Nykyään, kun teknologia kehittyy nopea...

2026年 Top 10 AWS工具和资源推荐Technology

2026年 Top 10 AWS工具和资源推荐

2026年 Top 10 AWS工具和资源推荐 在快速发展的云计算领域,Amazon Web Services (AWS) 一直是领军者,提供丰富的服务和工具,帮助开发者、企业和技术专家在云上有效工作。以下是2026年值得关注的十大AWS工...