107 беттік RAG және Agent&LLM жадына шолу

2/15/2026
4 min read

Бүгін мен Қытай халық университеті, Фудан университеті, Пекин университеті және т.б. университеттердің 107 беттік техникалық шолуын бөлісемін: «Жасанды интеллект агенттері дәуіріндегі жад: пішіндер, функциялар және динамика».

Жоба мекенжайы: https://github.com/Shichun-Liu/Agent-Memory-Paper-List

Мақала мекенжайы: https://arxiv.org/pdf/2512.13564

Соңғы екі жылда біз үлкен тілдік модельдердің (LLM) жасанды интеллект агенттеріне (AI Agents) таңғажайып эволюциясын көрдік. Deep Research-тен бастап бағдарламалық жасақтама инженериясына дейін, ғылыми жаңалықтардан көп агенттілік ынтымақтастыққа дейін, негізгі модельдерге негізделген бұл агенттер жасанды жалпы интеллектің (AGI) шекарасын кеңейтуде.

Бірақ бір маңызды сұрақ туындайды: LLM статикалық параметрлерін жылдам жаңарту мүмкін болмаса, агенттерді үздіксіз оқуға және бейімделуге қалай мүмкіндік беруге болады?

Жауап - Жад (Memory).

"Жад - статикалық LLM-ді қоршаған ортамен өзара әрекеттесу арқылы үздіксіз бейімделе алатын интеллект агентіне айналдырудың негізгі қабілеті."

1-суретте мақалада ұсынылған бірыңғай жіктеу шеңбері көрсетілген, ол агент жадын пішіндері (Forms), функциялары (Functions), динамикасы (Dynamics) сияқты үш өлшем бойынша ұйымдастырады және өкілді жүйелерді осы жіктеу жүйесіне картаға түсіреді.

Мақалада сонымен қатар Agent Memory мен тығыз байланысты, бірақ түбегейлі өзгеше ұғымдар арасында нақты айырмашылық жасалады: LLM жады, іздеуді жақсарту арқылы жасау (RAG) және контекст инженериясы. Олардың барлығы ақпаратты сақтау және пайдаланумен байланысты болғанымен, мақсаттарда, механизмдерде және қолдану сценарийлерінде маңызды айырмашылықтар бар.

Интеллект агентінің жад технологиясы

  • Өздігінен дамитын жад: Memento, H2R

  • Көп модальды жад: Ella, ViloMem, M3-Agent

  • Жасырын жад: MemoryLLM, M+, MemGen

  • Параметрлік жад: Retroformer, Early experience

  • RL-enabled Memory: MemAgent, RMM, MemSearcher, MEM1, Mem-alpha, Memory-R1

Интеллект агентінің жады vs. RAG

RAG-қа қатысты технологиялар:

  • Модульдік RAG: FlashRAG, ComposeRAG

  • Граф RAG: LightRAG, HippoRAG

  • Агенттік RAG: PlanRAG, Self-RAG

RAG және интеллект агентінің жады екеуі де модельдің мүмкіндіктерін жақсарту үшін сыртқы сақтау орнынан ақпаратты алуды қамтиды, бірақ екеуінің де жобалау философиясында түбегейлі айырмашылықтар бар:

ЕрекшелікRAGИнтеллект агентінің жады Негізгі мақсатАғымдағы сұрауға қатысты фондық білімді қолдауУақыт бойынша үздіксіз оқу және бейімделу мінез-құлқы Ақпарат көзіӘдетте статикалық, алдын ала құрастырылған білім базасыДинамикалық түрде жасалған, интеллект агентінің өзара әрекеттесу тәжірибесінен алынған жеке ақпарат Іздеуді іске қосуПайдаланушының сұрауымен пассивті түрде іске қосыладыИнтеллект агенті қашан, нені іздеу керектігін белсенді түрде шешеді Ақпаратты жаңартуБілім базасы әдетте офлайн режимінде жаңартыладыОнлайн, үздіксіз, таңдаулы түрде жаңартылады Кері байланыс цикліТікелей кері байланыс механизмі жоқҚоршаған ортамен өзара әрекеттесу арқылы тұйық цикл құрайды

Негізгі айырмашылық: RAG - білімді кеңейту құралы, ал интеллект агентінің жады - оқыту механизмі. RAG "Мен не білемін" деген сұраққа жауап береді, ал интеллект агентінің жады "Мен не үйрендім" деген сұраққа жауап береді.

Интеллект агентінің жады vs. LLM жады

LLM жадына қатысты технологиялар:

  • Attention KV management: Mixture-of-Memory

  • Ұзақ контексті өңдеу: Mamba, Memformer, MoA, Sparseformer, NSA

ӨлшемLLM жадыИнтеллект агентінің жады АнықтамаМодель параметрлерінде іштей біріктірілген білім немесе контекст терезесіндегі уақытша ақпаратИнтеллект агентінің қоршаған ортамен үздіксіз өзара әрекеттесуін, тапсырмалар арасында оқуды және ұзақ мерзімді бейімделуді қолдайтын сыртқы жүйе Уақыт шкаласыАлдын ала оқыту деректерімен немесе ағымдағы диалог контекстімен шектеледіКөптеген тапсырмаларды, сессияларды қамтиды, өмір бойы оқуды қолдайды Жаңарту мүмкіндігіПараметрлерді жаңарту қымбатқа түседі, контекстік ақпарат жоғалуы мүмкінТиімді, таңдаулы динамикалық жаңарту мен эволюцияны қолдайды БелсенділікСұрауға пассивті түрде жауап бередіҚандай ақпаратты сақтау, жаңарту, алу керектігін белсенді түрде шешеді Қоршаған ортамен байланысыҚоршаған ортамен тікелей өзара әрекеттесу жоқҚоршаған ортаның кері байланысымен терең интеграцияланған, интерактивті оқуды қолдайды

Негізгі айырмашылық: LLM жады мәні бойынша статикалық (параметрлер бекітілген) немесе қысқа мерзімді (контекст шектеулі), ал интеллект агентінің жады динамикалық, тұрақты, қоршаған ортамен байланысты.

Интеллект агентінің жады vs. Контекст инженериясы

Контекст инженериясына қатысты технологиялар:

  • Tool-integrated reasoning: ReTool, ToolLLM, Toolformer, VTool-R1, ToRL

  • Tool selection: AutoTool, VisTA

  • Communication protocol: ANP, A2A, MCP, Agora

АспектКонтекст инженериясыИнтеллект агентінің жады Назар аударуБір раундтық немесе ағымдағы тапсырманың кірісін оңтайландыруКөп раундтық, көп тапсырмалы ақпаратты тұрақтандыру және пайдалану Уақыт өлшеміАғымдағы сессияҰзақ мерзімді тарих Ақпаратты таңдауҚолмен жобаланған немесе эвристикалық ережелерАвтоматтандырылған қалыптастыру, эволюция, алу механизмі Күйді басқаруТұрақты күй жоқЭволюцияланатын жад күйін анық сақтау

Негізгі айырмашылық: Контекст инженериясы - ескертпелерді оңтайландыру технологиясы, ал интеллект агентінің жады - күйді басқару жүйесі. Біріншісі "Қазір не енгізу керек" дегенге назар аударады, ал екіншісі "Бұрын не есте сақталды, ол қазіргі мен болашаққа қалай әсер етеді" дегенге назар аударады.

Published in Technology

You Might Also Like

Бұлтты есептеу технологиясын қалай пайдалану керек: Сіздің алғашқы бұлттық инфрақұрылымыңызды құруға арналған толық нұсқаулықTechnology

Бұлтты есептеу технологиясын қалай пайдалану керек: Сіздің алғашқы бұлттық инфрақұрылымыңызды құруға арналған толық нұсқаулық

Бұлтты есептеу технологиясын қалай пайдалану керек: Сіздің алғашқы бұлттық инфрақұрылымыңызды құруға арналған толық нұсқ...

Ескерту! Claude Code-тың әкесі ашық айтты: 1 айдан кейін Plan Mode қолданылмайды, бағдарламалық инженер атағы жоғаладыTechnology

Ескерту! Claude Code-тың әкесі ашық айтты: 1 айдан кейін Plan Mode қолданылмайды, бағдарламалық инженер атағы жоғалады

Ескерту! Claude Code-тың әкесі ашық айтты: 1 айдан кейін Plan Mode қолданылмайды, бағдарламалық инженер атағы жоғалады ...

2026年 Top 10 深度学习资源推荐Technology

2026年 Top 10 深度学习资源推荐

2026年 Top 10 深度学习资源推荐 随着深度学习在各个领域的迅速发展,越来越多的学习资源和工具涌现出来。本文将为您推荐2026年最值得关注的十个深度学习资源,帮助您在这一领域中快速成长。 1. Coursera Deep Learn...

2026 жылғы Топ 10 AI агенттері: Негізгі артықшылықтарды талдауTechnology

2026 жылғы Топ 10 AI агенттері: Негізгі артықшылықтарды талдау

2026 жылғы Топ 10 AI агенттері: Негізгі артықшылықтарды талдау Кіріспе Жасанды интеллекттің жылдам дамуы арқасында AI аг...

2026 жыл: Топ 10 AI құралдары ұсынысы: Жасанды интеллектінің шынайы әлеуетін ашуTechnology

2026 жыл: Топ 10 AI құралдары ұсынысы: Жасанды интеллектінің шынайы әлеуетін ашу

2026 жыл: Топ 10 AI құралдары ұсынысы: Жасанды интеллектінің шынайы әлеуетін ашу Технологияның жылдам дамып жатқан бүгін...

2026 жылғы AWS құралдары мен ресурстарының 10 үздігіTechnology

2026 жылғы AWS құралдары мен ресурстарының 10 үздігі

2026 жылғы AWS құралдары мен ресурстарының 10 үздігі Жылдам дамып келе жатқан бұлтты есептеу саласында Amazon Web Servic...