107 беттік RAG және Agent&LLM жадына шолу

Бүгін мен Қытай халық университеті, Фудан университеті, Пекин университеті және т.б. университеттердің 107 беттік техникалық шолуын бөлісемін: «Жасанды интеллект агенттері дәуіріндегі жад: пішіндер, функциялар және динамика».

Жоба мекенжайы: https://github.com/Shichun-Liu/Agent-Memory-Paper-List

Мақала мекенжайы: https://arxiv.org/pdf/2512.13564

Соңғы екі жылда біз үлкен тілдік модельдердің (LLM) жасанды интеллект агенттеріне (AI Agents) таңғажайып эволюциясын көрдік. Deep Research-тен бастап бағдарламалық жасақтама инженериясына дейін, ғылыми жаңалықтардан көп агенттілік ынтымақтастыққа дейін, негізгі модельдерге негізделген бұл агенттер жасанды жалпы интеллектің (AGI) шекарасын кеңейтуде.

Бірақ бір маңызды сұрақ туындайды: LLM статикалық параметрлерін жылдам жаңарту мүмкін болмаса, агенттерді үздіксіз оқуға және бейімделуге қалай мүмкіндік беруге болады?

Жауап - Жад (Memory).

"Жад - статикалық LLM-ді қоршаған ортамен өзара әрекеттесу арқылы үздіксіз бейімделе алатын интеллект агентіне айналдырудың негізгі қабілеті."

1-суретте мақалада ұсынылған бірыңғай жіктеу шеңбері көрсетілген, ол агент жадын пішіндері (Forms), функциялары (Functions), динамикасы (Dynamics) сияқты үш өлшем бойынша ұйымдастырады және өкілді жүйелерді осы жіктеу жүйесіне картаға түсіреді.

Мақалада сонымен қатар Agent Memory мен тығыз байланысты, бірақ түбегейлі өзгеше ұғымдар арасында нақты айырмашылық жасалады: LLM жады, іздеуді жақсарту арқылы жасау (RAG) және контекст инженериясы. Олардың барлығы ақпаратты сақтау және пайдаланумен байланысты болғанымен, мақсаттарда, механизмдерде және қолдану сценарийлерінде маңызды айырмашылықтар бар.

Интеллект агентінің жад технологиясы

Өздігінен дамитын жад: Memento, H2R
Көп модальды жад: Ella, ViloMem, M3-Agent
Жасырын жад: MemoryLLM, M+, MemGen
Параметрлік жад: Retroformer, Early experience
RL-enabled Memory: MemAgent, RMM, MemSearcher, MEM1, Mem-alpha, Memory-R1

Интеллект агентінің жады vs. RAG

RAG-қа қатысты технологиялар:

Модульдік RAG: FlashRAG, ComposeRAG
Граф RAG: LightRAG, HippoRAG
Агенттік RAG: PlanRAG, Self-RAG

RAG және интеллект агентінің жады екеуі де модельдің мүмкіндіктерін жақсарту үшін сыртқы сақтау орнынан ақпаратты алуды қамтиды, бірақ екеуінің де жобалау философиясында түбегейлі айырмашылықтар бар:

ЕрекшелікRAGИнтеллект агентінің жады Негізгі мақсатАғымдағы сұрауға қатысты фондық білімді қолдауУақыт бойынша үздіксіз оқу және бейімделу мінез-құлқы Ақпарат көзіӘдетте статикалық, алдын ала құрастырылған білім базасыДинамикалық түрде жасалған, интеллект агентінің өзара әрекеттесу тәжірибесінен алынған жеке ақпарат Іздеуді іске қосуПайдаланушының сұрауымен пассивті түрде іске қосыладыИнтеллект агенті қашан, нені іздеу керектігін белсенді түрде шешеді Ақпаратты жаңартуБілім базасы әдетте офлайн режимінде жаңартыладыОнлайн, үздіксіз, таңдаулы түрде жаңартылады Кері байланыс цикліТікелей кері байланыс механизмі жоқҚоршаған ортамен өзара әрекеттесу арқылы тұйық цикл құрайды

Негізгі айырмашылық: RAG - білімді кеңейту құралы, ал интеллект агентінің жады - оқыту механизмі. RAG "Мен не білемін" деген сұраққа жауап береді, ал интеллект агентінің жады "Мен не үйрендім" деген сұраққа жауап береді.

Интеллект агентінің жады vs. LLM жады

LLM жадына қатысты технологиялар:

Attention KV management: Mixture-of-Memory
Ұзақ контексті өңдеу: Mamba, Memformer, MoA, Sparseformer, NSA

ӨлшемLLM жадыИнтеллект агентінің жады АнықтамаМодель параметрлерінде іштей біріктірілген білім немесе контекст терезесіндегі уақытша ақпаратИнтеллект агентінің қоршаған ортамен үздіксіз өзара әрекеттесуін, тапсырмалар арасында оқуды және ұзақ мерзімді бейімделуді қолдайтын сыртқы жүйе Уақыт шкаласыАлдын ала оқыту деректерімен немесе ағымдағы диалог контекстімен шектеледіКөптеген тапсырмаларды, сессияларды қамтиды, өмір бойы оқуды қолдайды Жаңарту мүмкіндігіПараметрлерді жаңарту қымбатқа түседі, контекстік ақпарат жоғалуы мүмкінТиімді, таңдаулы динамикалық жаңарту мен эволюцияны қолдайды БелсенділікСұрауға пассивті түрде жауап бередіҚандай ақпаратты сақтау, жаңарту, алу керектігін белсенді түрде шешеді Қоршаған ортамен байланысыҚоршаған ортамен тікелей өзара әрекеттесу жоқҚоршаған ортаның кері байланысымен терең интеграцияланған, интерактивті оқуды қолдайды

Негізгі айырмашылық: LLM жады мәні бойынша статикалық (параметрлер бекітілген) немесе қысқа мерзімді (контекст шектеулі), ал интеллект агентінің жады динамикалық, тұрақты, қоршаған ортамен байланысты.

Интеллект агентінің жады vs. Контекст инженериясы

Контекст инженериясына қатысты технологиялар:

Tool-integrated reasoning: ReTool, ToolLLM, Toolformer, VTool-R1, ToRL
Tool selection: AutoTool, VisTA
Communication protocol: ANP, A2A, MCP, Agora

АспектКонтекст инженериясыИнтеллект агентінің жады Назар аударуБір раундтық немесе ағымдағы тапсырманың кірісін оңтайландыруКөп раундтық, көп тапсырмалы ақпаратты тұрақтандыру және пайдалану Уақыт өлшеміАғымдағы сессияҰзақ мерзімді тарих Ақпаратты таңдауҚолмен жобаланған немесе эвристикалық ережелерАвтоматтандырылған қалыптастыру, эволюция, алу механизмі Күйді басқаруТұрақты күй жоқЭволюцияланатын жад күйін анық сақтау

Негізгі айырмашылық: Контекст инженериясы - ескертпелерді оңтайландыру технологиясы, ал интеллект агентінің жады - күйді басқару жүйесі. Біріншісі "Қазір не енгізу керек" дегенге назар аударады, ал екіншісі "Бұрын не есте сақталды, ол қазіргі мен болашаққа қалай әсер етеді" дегенге назар аударады.

107 беттік RAG және Agent&LLM жадына шолу

Интеллект агентінің жад технологиясы

Интеллект агентінің жады vs. RAG

Интеллект агентінің жады vs. LLM жады

Интеллект агентінің жады vs. Контекст инженериясы

You Might Also Like

Claude Code Buddy өзгерту нұсқаулығы: қалай жарқыраған аңыз деңгейіндегі питомец алуға болады

Obsidian Defuddle-ды шығарды, Obsidian Web Clipper-ді жаңа деңгейге көтерді

OpenAI кенеттен "үш бірлікті" жариялады: браузер + бағдарламалау + ChatGPT бірігуі, ішкі деңгейде өткен жылы қателескенін мойындады

2026, өзіңізді "тәртіпке" мәжбүрлемеңіз! Бұл 8 кішігірім істі орындаңыз, денсаулық өздігінен келеді

Салмақ тастауға тырысқан, бірақ арықтай алмай жүрген аналар, мүлдем осында құлайды

AI Browser 24 сағат тұрақты жұмыс істеу нұсқаулығы