Преглед на 107 страници за RAG и Agent&LLM меморија

Денес споделувам технички преглед од 107 страници од Универзитетот Ренмин, Универзитетот Фудан, Универзитетот во Пекинг итн., насловен како „Memory in the Age of AI Agents: A Survey Forms, Functions and Dynamics“ (Меморија во ерата на AI агентите: Преглед на форми, функции и динамика).

Адреса на проектот: https://github.com/Shichun-Liu/Agent-Memory-Paper-List

Адреса на трудот: https://arxiv.org/pdf/2512.13564

Во текот на изминатите две години, бевме сведоци на неверојатната еволуција на големите јазични модели (LLM) во AI интелигентни агенти (AI Agents). Од Deep Research до софтверско инженерство, од научно откритие до соработка со повеќе агенти, овие интелигентни агенти засновани на основни модели ги поместуваат границите на вештачката општа интелигенција (AGI).

Но, се појавува едно клучно прашање: Како да се овозможи на агентите континуирано учење и приспособливост кога статичните LLM параметри не можат брзо да се ажурираат?

Одговорот е - меморија (Memory).

„Меморијата е клучната способност да се трансформираат статичните LLM во интелигентни агенти кои можат континуирано да се прилагодуваат преку интеракција со околината.“

Figure 1 (Слика 1) го прикажува унифицираниот рамковен модел предложен во трудот, кој ја организира меморијата на агентот според три димензии: форми (Forms), функции (Functions) и динамика (Dynamics), и ги мапира репрезентативните системи во овој систем на класификација.

Трудот, исто така, прави јасна разлика помеѓу Agent Memory и неколку тесно поврзани, но суштински различни концепти: LLM меморија, Retrieval-Augmented Generation (RAG) (Генерирање збогатено со пребарување (RAG)) и context engineering (контекстуален инженеринг). Иако сите тие се поврзани со складирање и користење на информации, постојат клучни разлики во целите, механизмите и сценаријата за апликација.

Технологии за меморија на агенти

Self-Evolving Memory (Само-еволуирачка меморија): Memento, H2R
Multimodal Memory (Мултимодална меморија): Ella, ViloMem, M3-Agent
Latent Memory (Латентна меморија): MemoryLLM, M+, MemGen
Parametric Memory (Параметриска меморија): Retroformer, Early experience
RL-enabled Memory (Меморија овозможена со RL): MemAgent, RMM, MemSearcher, MEM1, Mem-alpha, Memory-R1

Меморија на агенти vs. RAG

RAG поврзани технологии:

Modular RAG (Модуларен RAG): FlashRAG, ComposeRAG
Graph RAG (Графички RAG): LightRAG, HippoRAG
Agentic RAG (Агентички RAG): PlanRAG, Self-RAG

RAG и меморијата на агентите вклучуваат пребарување информации од надворешно складирање за да се подобрат способностите на моделот, но постои суштинска разлика во дизајнерската филозофија помеѓу двете:

КарактеристикаRAGМеморија на агенти Основна целОбезбедување релевантна поддршка за позадина за тековното барањеКонтинуирано учење и адаптивно однесување со текот на времето Извор на информацииОбично статична, претходно изградена база на знаењеДинамички генерирани, персонализирани информации од сопственото интерактивно искуство на агентот Активирање на пребарувањеПасивно активирано од корисничко барањеАктивно одлучено од агентот кога и што да пребарува Ажурирање на информацииБазата на знаење обично се ажурира офлајнОнлајн, континуирано и селективно ажурирање Повратна јамкаНема директен механизам за повратна информацијаФормира затворена јамка со интеракција со околината

Клучна разлика: RAG е алатка за проширување на знаењето, додека меморијата на агентот е механизам за учење. RAG одговара на „Што знам“, а меморијата на агентот одговара на „Што научив“.

Меморија на агенти vs. LLM меморија

LLM поврзани технологии за меморија:

Attention KV management (Управување со внимание KV): Mixture-of-Memory
Long context processing (Обработка на долг контекст): Mamba, Memformer, MoA, Sparseformer, NSA

ДимензијаLLM меморијаМеморија на агенти ДефиницијаИнтернализирано знаење во параметрите на моделот или привремени информации во контекстуалниот прозорецНадворешен систем кој поддржува континуирана интеракција на агентот со околината, учење преку задачи и долгорочна адаптација Временска скалаОграничено на податоци за претходно тренирање или тековен контекст на дијалогСе протега на повеќе задачи, сесии и поддржува доживотно учење АжурирањеТрошоците за ажурирање на параметрите се високи, а контекстуалните информации се нестабилниПоддржува ефикасно, селективно динамичко ажурирање и еволуција АктивностПасивно одговара на барањаАктивно одлучува што да складира, ажурира и пребарува Поврзаност со околинатаНема директна интеракција со околинатаДлабоко интегрирана повратна информација од околината, поддржува интерактивно учење

Клучна разлика: LLM меморијата е во суштина статична (фиксирани параметри) или краткотрајна (ограничен контекст), додека меморијата на агентот е динамична, постојана и поврзана со околината.

Меморија на агенти vs. Контекстуален инженеринг

Контекстуален инженеринг поврзани технологии:

Tool-integrated reasoning (Расудување интегрирано со алатки): ReTool, ToolLLM, Toolformer, VTool-R1, ToRL
Tool selection (Избор на алатки): AutoTool, VisTA
Communication protocol (Комуникациски протокол): ANP, A2A, MCP, Agora

АспектКонтекстуален инженерингМеморија на агенти ФокусОптимизација на влез за еднократно или тековно извршување на задачаТрајно зачувување и користење на информации преку повеќекратни извршувања на задачи Временска димензијаТековна сесијаДолга историја Избор на информацииРачно дизајнирани или хеуристички правилаАвтоматизиран механизам за формирање, еволуција и пребарување Управување со состојбаНема трајна состојбаЕксплицитно одржување на еволуирачка состојба на меморија

Клучна разлика: Контекстуалниот инженеринг е техника за оптимизација на поттикнување, додека меморијата на агентот е систем за управување со состојби. Првиот се фокусира на „Што да се внесе сега“, а вториот се фокусира на „Што се запаметило во минатото и како тоа влијае на сегашноста и иднината“.

Преглед на 107 страници за RAG и Agent&LLM меморија

Технологии за меморија на агенти

Меморија на агенти vs. RAG

Меморија на агенти vs. LLM меморија

Меморија на агенти vs. Контекстуален инженеринг

You Might Also Like

Claude Code Buddy измена упатство: Како да добиете сјаен легендарен милениче

Obsidian ја лансираше Defuddle, го подигна Obsidian Web Clipper на ново ниво

OpenAI ненадејно објави "три во едно": спојување на прелистувач, програмирање и ChatGPT, внатрешно признавање на погрешниот пат во изминатата година

2026, не се присилувајте на "самодисциплина"! Направете ги овие 8 мали работи, здравјето ќе дојде природно

Тие мајки кои се трудат да ослабат, но не успеваат, сигурно се заглавени тука

AI Browser 24 часов стабилно работење водич