Преглед на 107 страници за RAG и Agent&LLM меморија

2/15/2026
4 min read

Денес споделувам технички преглед од 107 страници од Универзитетот Ренмин, Универзитетот Фудан, Универзитетот во Пекинг итн., насловен како „Memory in the Age of AI Agents: A Survey Forms, Functions and Dynamics“ (Меморија во ерата на AI агентите: Преглед на форми, функции и динамика).

Адреса на проектот: https://github.com/Shichun-Liu/Agent-Memory-Paper-List

Адреса на трудот: https://arxiv.org/pdf/2512.13564

Во текот на изминатите две години, бевме сведоци на неверојатната еволуција на големите јазични модели (LLM) во AI интелигентни агенти (AI Agents). Од Deep Research до софтверско инженерство, од научно откритие до соработка со повеќе агенти, овие интелигентни агенти засновани на основни модели ги поместуваат границите на вештачката општа интелигенција (AGI).

Но, се појавува едно клучно прашање: Како да се овозможи на агентите континуирано учење и приспособливост кога статичните LLM параметри не можат брзо да се ажурираат?

Одговорот е - меморија (Memory).

„Меморијата е клучната способност да се трансформираат статичните LLM во интелигентни агенти кои можат континуирано да се прилагодуваат преку интеракција со околината.“

Figure 1 (Слика 1) го прикажува унифицираниот рамковен модел предложен во трудот, кој ја организира меморијата на агентот според три димензии: форми (Forms), функции (Functions) и динамика (Dynamics), и ги мапира репрезентативните системи во овој систем на класификација.

Трудот, исто така, прави јасна разлика помеѓу Agent Memory и неколку тесно поврзани, но суштински различни концепти: LLM меморија, Retrieval-Augmented Generation (RAG) (Генерирање збогатено со пребарување (RAG)) и context engineering (контекстуален инженеринг). Иако сите тие се поврзани со складирање и користење на информации, постојат клучни разлики во целите, механизмите и сценаријата за апликација.

Технологии за меморија на агенти

  • Self-Evolving Memory (Само-еволуирачка меморија): Memento, H2R

  • Multimodal Memory (Мултимодална меморија): Ella, ViloMem, M3-Agent

  • Latent Memory (Латентна меморија): MemoryLLM, M+, MemGen

  • Parametric Memory (Параметриска меморија): Retroformer, Early experience

  • RL-enabled Memory (Меморија овозможена со RL): MemAgent, RMM, MemSearcher, MEM1, Mem-alpha, Memory-R1

Меморија на агенти vs. RAG

RAG поврзани технологии:

  • Modular RAG (Модуларен RAG): FlashRAG, ComposeRAG

  • Graph RAG (Графички RAG): LightRAG, HippoRAG

  • Agentic RAG (Агентички RAG): PlanRAG, Self-RAG

RAG и меморијата на агентите вклучуваат пребарување информации од надворешно складирање за да се подобрат способностите на моделот, но постои суштинска разлика во дизајнерската филозофија помеѓу двете:

КарактеристикаRAGМеморија на агенти Основна целОбезбедување релевантна поддршка за позадина за тековното барањеКонтинуирано учење и адаптивно однесување со текот на времето Извор на информацииОбично статична, претходно изградена база на знаењеДинамички генерирани, персонализирани информации од сопственото интерактивно искуство на агентот Активирање на пребарувањеПасивно активирано од корисничко барањеАктивно одлучено од агентот кога и што да пребарува Ажурирање на информацииБазата на знаење обично се ажурира офлајнОнлајн, континуирано и селективно ажурирање Повратна јамкаНема директен механизам за повратна информацијаФормира затворена јамка со интеракција со околината

Клучна разлика: RAG е алатка за проширување на знаењето, додека меморијата на агентот е механизам за учење. RAG одговара на „Што знам“, а меморијата на агентот одговара на „Што научив“.

Меморија на агенти vs. LLM меморија

LLM поврзани технологии за меморија:

  • Attention KV management (Управување со внимание KV): Mixture-of-Memory

  • Long context processing (Обработка на долг контекст): Mamba, Memformer, MoA, Sparseformer, NSA

ДимензијаLLM меморијаМеморија на агенти ДефиницијаИнтернализирано знаење во параметрите на моделот или привремени информации во контекстуалниот прозорецНадворешен систем кој поддржува континуирана интеракција на агентот со околината, учење преку задачи и долгорочна адаптација Временска скалаОграничено на податоци за претходно тренирање или тековен контекст на дијалогСе протега на повеќе задачи, сесии и поддржува доживотно учење АжурирањеТрошоците за ажурирање на параметрите се високи, а контекстуалните информации се нестабилниПоддржува ефикасно, селективно динамичко ажурирање и еволуција АктивностПасивно одговара на барањаАктивно одлучува што да складира, ажурира и пребарува Поврзаност со околинатаНема директна интеракција со околинатаДлабоко интегрирана повратна информација од околината, поддржува интерактивно учење

Клучна разлика: LLM меморијата е во суштина статична (фиксирани параметри) или краткотрајна (ограничен контекст), додека меморијата на агентот е динамична, постојана и поврзана со околината.

Меморија на агенти vs. Контекстуален инженеринг

Контекстуален инженеринг поврзани технологии:

  • Tool-integrated reasoning (Расудување интегрирано со алатки): ReTool, ToolLLM, Toolformer, VTool-R1, ToRL

  • Tool selection (Избор на алатки): AutoTool, VisTA

  • Communication protocol (Комуникациски протокол): ANP, A2A, MCP, Agora

АспектКонтекстуален инженерингМеморија на агенти ФокусОптимизација на влез за еднократно или тековно извршување на задачаТрајно зачувување и користење на информации преку повеќекратни извршувања на задачи Временска димензијаТековна сесијаДолга историја Избор на информацииРачно дизајнирани или хеуристички правилаАвтоматизиран механизам за формирање, еволуција и пребарување Управување со состојбаНема трајна состојбаЕксплицитно одржување на еволуирачка состојба на меморија

Клучна разлика: Контекстуалниот инженеринг е техника за оптимизација на поттикнување, додека меморијата на агентот е систем за управување со состојби. Првиот се фокусира на „Што да се внесе сега“, а вториот се фокусира на „Што се запаметило во минатото и како тоа влијае на сегашноста и иднината“.

Published in Technology

You Might Also Like

Како да користите технологии на облачното компјутерство: Комплетен водич за изградба на вашата прва облачна инфраструктураTechnology

Како да користите технологии на облачното компјутерство: Комплетен водич за изградба на вашата прва облачна инфраструктура

Како да користите технологии на облачното компјутерство: Комплетен водич за изградба на вашата прва облачна инфраструкту...

Предупредување! Основачот на Claude Code изјави: По еден месец, Plan Mode нема да се користи, титулата софтверски инженер ќе исчезнеTechnology

Предупредување! Основачот на Claude Code изјави: По еден месец, Plan Mode нема да се користи, титулата софтверски инженер ќе исчезне

Предупредување! Основачот на Claude Code изјави: По еден месец, Plan Mode нема да се користи, титулата софтверски инжене...

2026 година Топ 10 ресурси за длабоко учењеTechnology

2026 година Топ 10 ресурси за длабоко учење

2026 година Топ 10 ресурси за длабоко учење Со брзиот развој на длабокото учење во различни области, се појавуваат се по...

2026 година Топ 10 AI агенти: Анализа на основните карактеристикиTechnology

2026 година Топ 10 AI агенти: Анализа на основните карактеристики

2026 година Топ 10 AI агенти: Анализа на основните карактеристики Вовед Со брзиот развој на вештачката интелигенција, AI...

2026 година Топ 10 AI алатки препораки: Ослободување на вистинскиот потенцијал на вештачката интелигенцијаTechnology

2026 година Топ 10 AI алатки препораки: Ослободување на вистинскиот потенцијал на вештачката интелигенција

2026 година Топ 10 AI алатки препораки: Ослободување на вистинскиот потенцијал на вештачката интелигенција Во денешно вр...

2026年 Top 10 AWS工具和资源推荐Technology

2026年 Top 10 AWS工具和资源推荐

2026年 Top 10 AWS工具和资源推荐 Во брзо развивачкиот облачен компјутинг сектор, Amazon Web Services (AWS) секогаш бил лидер, нуд...