107-stranska analiza RAG in spomina Agent&LLM

Danes delim 107-stransko tehnično analizo avtorjev z Univerze Renmin, Fudan, Peking itd., z naslovom »Spomin v dobi AI agentov: Pregled oblik, funkcij in dinamike«.

Naslov projekta: https://github.com/Shichun-Liu/Agent-Memory-Paper-List

Naslov članka: https://arxiv.org/pdf/2512.13564

V zadnjih dveh letih smo bili priča neverjetnemu razvoju velikih jezikovnih modelov (LLM) v AI agente (AI Agents). Od Deep Research do programske opreme, od znanstvenih odkritij do sodelovanja med več agenti, ti agenti, ki temeljijo na temeljnih modelih, premikajo meje umetne splošne inteligence (AGI).

Vendar se pojavlja osrednje vprašanje: Kako lahko agenti ohranijo sposobnost stalnega učenja in prilagajanja, če statičnih parametrov LLM ni mogoče hitro posodobiti?

Odgovor je – spomin (Memory).

»Spomin je ključna sposobnost za preoblikovanje statičnih LLM v agente, ki se lahko nenehno prilagajajo z interakcijo z okoljem.«

Slika 1 prikazuje enoten klasifikacijski okvir, ki ga predlaga članek, ki organizira spomin agenta glede na tri dimenzije: oblike (Forms), funkcije (Functions) in dinamika (Dynamics), in preslikuje reprezentativne sisteme v ta klasifikacijski sistem.

Članek tudi jasno razlikuje med spominom agenta in več tesno povezanimi, a bistveno različnimi koncepti: LLM spomin, generiranje z izboljšanim iskanjem (RAG) in kontekstni inženiring . Čeprav so vsi povezani s shranjevanjem in uporabo informacij, obstajajo ključne razlike v ciljih, mehanizmih in scenarijih uporabe.

Tehnologija spomina agenta

Self-Evolving Memory: Memento, H2R
Multimodal Memory: Ella, ViloMem, M3-Agent
Latent Memory: MemoryLLM, M+, MemGen
Parametric Memory: Retroformer, Early experience
RL-enabled Memory: MemAgent, RMM, MemSearcher, MEM1, Mem-alpha, Memory-R1

Spomin agenta vs. RAG

RAG povezane tehnologije:

Modular RAG: FlashRAG, ComposeRAG
Graph RAG: LightRAG, HippoRAG
Agentic RAG: PlanRAG, Self-RAG

RAG in spomin agenta vključujeta pridobivanje informacij iz zunanjega pomnilnika za izboljšanje zmogljivosti modela, vendar obstaja bistvena razlika v filozofiji oblikovanja med obema:

ZnačilnostiRAGSpomin agenta Osrednji ciljZagotavljanje ustrezne podpore ozadja za trenutno poizvedboStalno učenje in prilagodljivo vedenje skozi čas Vir informacijObičajno statična, vnaprej zgrajena baza znanjaDinamično ustvarjene, personalizirane informacije iz lastnih interakcijskih izkušenj agenta Sprožilec iskanjaPasivno sproži uporabniška poizvedbaAgent se aktivno odloča, kdaj in kaj iskati Posodobitev informacijBaza znanja se običajno posodablja brez povezaveSpletna, stalna in selektivna posodobitev Povratna zankaBrez mehanizma neposredne povratne informacijeOblikovanje zaprte zanke z interakcijo z okoljem

Ključna razlika: RAG je orodje za razširitev znanja, spomin agenta pa je učni mehanizem. RAG odgovarja na »Kaj vem«, spomin agenta pa odgovarja na »Kaj sem se naučil«.

Spomin agenta vs. LLM spomin

LLM povezane tehnologije spomina:

Attention KV management: Mixture-of-Memory
Long context processing: Mamba, Memformer, MoA, Sparseformer, NSA

DimenzijaLLM spominSpomin agenta DefinicijaZnanje, internalizirano v parametrih modela, ali začasne informacije v kontekstnem oknuZunanji sistem, ki podpira stalno interakcijo agenta z okoljem, učenje med nalogami in dolgoročno prilagajanje Časovna lestvicaOmejeno na podatke o predhodnem usposabljanju ali trenutni kontekst pogovoraPresega več nalog, sej in podpira vseživljenjsko učenje PosodobljenostPosodobitev parametrov je draga, informacije o kontekstu so nestanovitnePodpira učinkovito, selektivno dinamično posodabljanje in razvoj AktivnostPasivno odzivanje na poizvedbeAktivno se odloča, katere informacije shraniti, posodobiti in pridobiti Povezava z okoljemBrez neposredne interakcije z okoljemGloboka integracija povratnih informacij iz okolja, podpira interaktivno učenje

Ključna razlika: LLM spomin je v bistvu statičen (fiksni parametri) ali kratek (omejen kontekst), medtem ko je spomin agenta dinamičen, trajen in povezan z okoljem.

Spomin agenta vs. Kontekstni inženiring

Kontekstni inženiring povezane tehnologije:

Tool-integrated reasoning: ReTool, ToolLLM, Toolformer, VTool-R1, ToRL
Tool selection: AutoTool, VisTA
Communication protocol: ANP, A2A, MCP, Agora

VidikKontekstni inženiringSpomin agenta OsredotočenostOptimizacija vnosa za en sam krog ali trenutno nalogoTrajna in večkratna uporaba informacij v več krogih in nalogah Časovna dimenzijaTrenutna sejaDolga zgodovina Izbira informacijRočno oblikovana ali hevristična pravilaAvtomatiziran mehanizem oblikovanja, razvoja in pridobivanja Upravljanje stanjaBrez trajnega stanjaEksplicitno vzdrževanje razvijajočega se stanja spomina

Ključna razlika: Kontekstni inženiring je tehnika optimizacije poziva, spomin agenta pa je sistem za upravljanje stanja. Prvi se osredotoča na »Kaj vnesti zdaj«, drugi pa na »Kaj si zapomnim iz preteklosti in kako to vpliva na sedanjost in prihodnost«.

107-stranska analiza RAG in spomina Agent&LLM

Tehnologija spomina agenta

Spomin agenta vs. RAG

Spomin agenta vs. LLM spomin

Spomin agenta vs. Kontekstni inženiring

You Might Also Like

Claude Code Buddy 修改指南：如何获得闪光传说级宠物

Obsidian je predstavil Defuddle, ki je Obsidian Web Clipper dvignil na novo raven

OpenAI nenadoma napoveduje "tri v enem": združitev brskalnika + programiranja + ChatGPT, notranje priznanje, da so v preteklem letu zgrešili pot

2026, ne silite se več v 'discipliniranost'! Poskrbite za teh 8 malenkosti, zdravje bo prišlo naravno

Tiste mame, ki se trudijo shujšati, a jim ne uspe, so zagotovo tukaj naletele na težave

AI Browser 24-urna stabilna delovna navodila