RAG နှင့် Agent&LLM မှတ်ဉာဏ်ဆိုင်ရာ ၁၀၇ မျက်နှာပါ သုံးသပ်ချက်
ယနေ့တွင် လူထုကောလိပ်၊ ဖူဒန်တက္ကသိုလ်၊ ပေကျင်းတက္ကသိုလ်တို့မှ ပူးပေါင်းရေးသားထားသော စာမျက်နှာ ၁၀၇ မျက်နှာပါရှိသည့် နည်းပညာဆိုင်ရာ သုံးသပ်ချက်ဖြစ်သော 《AI Agents ခေတ်တွင် မှတ်ဉာဏ်- ပုံစံများ၊ လုပ်ဆောင်ချက်များနှင့် လှုပ်ရှားမှုများ》ကို မျှဝေပေးသွားပါမည်။
ပရောဂျက်လိပ်စာ- https://github.com/Shichun-Liu/Agent-Memory-Paper-List
စာတမ်းလိပ်စာ- https://arxiv.org/pdf/2512.13564

လွန်ခဲ့သော နှစ်နှစ်အတွင်း၊ ကျွန်ုပ်တို့သည် ကြီးမားသော ဘာသာစကားမော်ဒယ်များ (LLM) မှ AI ဉာဏ်ရည်တု (AI Agents) များအဖြစ် အံ့မခန်းတိုးတက်ပြောင်းလဲလာသည်ကို တွေ့မြင်ခဲ့ရပါသည်။ Deep Research မှသည် ဆော့ဖ်ဝဲလ်အင်ဂျင်နီယာအထိ၊ သိပ္ပံဆိုင်ရာ ရှာဖွေတွေ့ရှိမှုများမှသည် ဉာဏ်ရည်တုအများအပြား ပူးပေါင်းဆောင်ရွက်မှုများအထိ၊ အခြေခံမော်ဒယ်များကို အခြေခံထားသော ဤဉာဏ်ရည်တုများသည် လူလုပ်အထွေထွေဉာဏ်ရည်တု (AGI) ၏ နယ်နိမိတ်များကို တွန်းအားပေးနေပါသည်။
သို့သော် အဓိကမေးခွန်းတစ်ခု ပေါ်ပေါက်လာသည်- တည်ငြိမ်သော LLM ပါရာမီတာများကို အလျင်အမြန် အပ်ဒိတ်မလုပ်နိုင်ပါက၊ ဉာဏ်ရည်တုများကို စဉ်ဆက်မပြတ် သင်ယူနိုင်စွမ်းနှင့် လိုက်လျောညီထွေဖြစ်အောင် မည်သို့ပြုလုပ်နိုင်မည်နည်း။
အဖြေမှာ- မှတ်ဉာဏ် (Memory) ဖြစ်သည်။
"မှတ်ဉာဏ်သည် ပတ်ဝန်းကျင်နှင့် အပြန်အလှန်ဆက်သွယ်ခြင်းဖြင့် စဉ်ဆက်မပြတ် လိုက်လျောညီထွေဖြစ်အောင် ပြုလုပ်နိုင်သော ဉာဏ်ရည်တုများအဖြစ် တည်ငြိမ်သော LLM ကို ပြောင်းလဲပေးနိုင်သည့် အဓိကစွမ်းရည်ဖြစ်သည်။"

ပုံ ၁ သည် စာတမ်းမှ အဆိုပြုထားသော စည်းလုံးညီညွတ်သော အမျိုးအစားခွဲခြားခြင်းဆိုင်ရာ မူဘောင်ကို ပြသထားပြီး၊ ဉာဏ်ရည်တုမှတ်ဉာဏ်ကို ပုံစံများ (Forms)၊ လုပ်ဆောင်ချက်များ (Functions)၊ လှုပ်ရှားမှုများ (Dynamics) ဟူသော အတိုင်းအတာသုံးခုဖြင့် စုစည်းထားပြီး ကိုယ်စားပြုစနစ်များကို ဤအမျိုးအစားခွဲခြားခြင်းစနစ်တွင် မြေပုံရေးဆွဲထားပါသည်။

စာတမ်းသည် Agent Memory နှင့် အလွန်ဆက်စပ်သော်လည်း မတူညီသော အယူအဆများကိုလည်း ရှင်းရှင်းလင်းလင်း ခွဲခြားထားသည်- LLM မှတ်ဉာဏ်၊ ပြန်လည်ရယူခြင်းအား မြှင့်တင်ထားသော ထုတ်လုပ်ခြင်း (RAG) နှင့် အကြောင်းအရာအင်ဂျင်နီယာ။ ၎င်းတို့အားလုံးသည် သတင်းအချက်အလက်များကို သိမ်းဆည်းခြင်းနှင့် အသုံးချခြင်းနှင့် သက်ဆိုင်သော်လည်း ရည်ရွယ်ချက်၊ ယန္တရားနှင့် အသုံးချမှုမြင်ကွင်းများတွင် အဓိကကွာခြားချက်များရှိပါသည်။
ဉာဏ်ရည်တုမှတ်ဉာဏ်နည်းပညာ
-
Self-Evolving Memory- Memento, H2R
-
Multimodal Memory- Ella, ViloMem, M3-Agent
-
Latent Memory- MemoryLLM, M+, MemGen
-
Parametric Memory- Retroformer, Early experience
-
RL-enabled Memory- MemAgent, RMM, MemSearcher, MEM1, Mem-alpha, Memory-R1
ဉာဏ်ရည်တုမှတ်ဉာဏ်နှင့် RAG
RAG ဆက်စပ်နည်းပညာများ-
-
Modular RAG- FlashRAG, ComposeRAG
-
Graph RAG- LightRAG, HippoRAG
-
Agentic RAG- PlanRAG, Self-RAG
RAG နှင့် ဉာဏ်ရည်တုမှတ်ဉာဏ်နှစ်ခုစလုံးသည် မော်ဒယ်စွမ်းရည်ကို မြှင့်တင်ရန်အတွက် ပြင်ပသိုလှောင်မှုမှ သတင်းအချက်အလက်များကို ပြန်လည်ရယူခြင်းနှင့် သက်ဆိုင်သော်လည်း ဒီဇိုင်းဆိုင်ရာ အတွေးအခေါ်တွင် အဓိကကွာခြားချက်များရှိပါသည်။
အင်္ဂါရပ်RAGဉာဏ်ရည်တုမှတ်ဉာဏ် အဓိကရည်ရွယ်ချက်လက်ရှိရှာဖွေမှုအတွက် သက်ဆိုင်ရာနောက်ခံဗဟုသုတကို ပံ့ပိုးပေးခြင်းအချိန်ကြာမြင့်စွာ စဉ်ဆက်မပြတ်သင်ယူခြင်းနှင့် ကိုယ်တိုင်လိုက်လျောညီထွေဖြစ်အောင် ပြုမူခြင်း သတင်းအချက်အလက်အရင်းအမြစ်များများသောအားဖြင့် တည်ငြိမ်သော၊ ကြိုတင်တည်ဆောက်ထားသော ဗဟုသုတအခြေခံအချက်အလက်များဉာဏ်ရည်တု၏ အပြန်အလှန်အတွေ့အကြုံမှ ရရှိသော ကိုယ်ပိုင်သတင်းအချက်အလက်များကို တက်ကြွစွာထုတ်လုပ်ခြင်း ပြန်လည်ရယူခြင်းကို စတင်ခြင်းအသုံးပြုသူ၏ ရှာဖွေမှုဖြင့် တုံ့ပြန်ခြင်းဉာဏ်ရည်တုက မည်သည့်အချိန်တွင်၊ မည်သည့်အရာကို ပြန်လည်ရယူရမည်ကို တက်ကြွစွာ ဆုံးဖြတ်ခြင်း သတင်းအချက်အလက်ကို အပ်ဒိတ်လုပ်ခြင်းဗဟုသုတအခြေခံအချက်အလက်များကို များသောအားဖြင့် အော့ဖ်လိုင်းတွင် အပ်ဒိတ်လုပ်ခြင်းအွန်လိုင်း၊ စဉ်ဆက်မပြတ်၊ ရွေးချယ်၍ အပ်ဒိတ်လုပ်ခြင်း တုံ့ပြန်ချက်ကွင်းဆက်တိုက်ရိုက်တုံ့ပြန်ချက်ယန္တရားမရှိပတ်ဝန်းကျင်နှင့် အပြန်အလှန်ဆက်သွယ်ခြင်းဖြင့် အပိတ်ကွင်းဆက်ကို ဖြစ်ပေါ်စေခြင်း အဓိကကွာခြားချက်- RAG သည် ဗဟုသုတချဲ့ထွင်သည့်ကိရိယာ ဖြစ်ပြီး ဉာဏ်ရည်တုမှတ်ဉာဏ်သည် သင်ယူမှုယန္တရား ဖြစ်သည်။ RAG က "ငါဘာသိလဲ" ဟုဖြေဆိုပြီး ဉာဏ်ရည်တုမှတ်ဉာဏ်က "ငါဘာသင်ယူခဲ့လဲ" ဟုဖြေဆိုသည်။
ဉာဏ်ရည်တုမှတ်ဉာဏ်နှင့် LLM မှတ်ဉာဏ်
LLM မှတ်ဉာဏ်နှင့် သက်ဆိုင်သော နည်းပညာများ-
-
Attention KV management- Mixture-of-Memory
-
Long context processing- Mamba, Memformer, MoA, Sparseformer, NSA
အတိုင်းအတာLLM မှတ်ဉာဏ်ဉာဏ်ရည်တုမှတ်ဉာဏ် အဓိပ္ပါယ်မော်ဒယ်ပါရာမီတာများတွင် အတွင်းကျကျပါဝင်သော ဗဟုသုတ သို့မဟုတ် အကြောင်းအရာဝင်းဒိုးရှိ ယာယီသတင်းအချက်အလက်များဉာဏ်ရည်တုသည် ပတ်ဝန်းကျင်နှင့် စဉ်ဆက်မပြတ် အပြန်အလှန်ဆက်သွယ်ခြင်း၊ လုပ်ငန်းတာဝန်အများအပြားကို သင်ယူခြင်းနှင့် ရေရှည်လိုက်လျောညီထွေဖြစ်အောင် ပြုလုပ်ခြင်းတို့ကို ပံ့ပိုးပေးသည့် ပြင်ပစနစ် အချိန်အတိုင်းအတာကြိုတင်လေ့ကျင့်ထားသော ဒေတာ သို့မဟုတ် လက်ရှိစကားပြောဆိုမှုအကြောင်းအရာတွင်သာ ကန့်သတ်ထားသည်လုပ်ငန်းတာဝန်အများအပြား၊ ဆွေးနွေးမှုများကို ဖြတ်ကျော်၍ တစ်သက်တာလုံး သင်ယူမှုကို ပံ့ပိုးပေးသည် အပ်ဒိတ်လုပ်နိုင်စွမ်းပါရာမီတာကို အပ်ဒိတ်လုပ်ရန် ကုန်ကျစရိတ်ကြီးမြင့်ပြီး အကြောင်းအရာသတင်းအချက်အလက်များ ပျောက်ဆုံးရန်လွယ်ကူသည်ထိရောက်သော၊ ရွေးချယ်၍ အလိုအလျောက် အပ်ဒိတ်လုပ်ခြင်းနှင့် တိုးတက်ပြောင်းလဲခြင်းတို့ကို ပံ့ပိုးပေးသည် တက်ကြွမှုရှာဖွေမှုကို တုံ့ပြန်ခြင်းဖြင့် တုံ့ပြန်ခြင်းမည်သည့်သတင်းအချက်အလက်ကို သိမ်းဆည်းရမည်၊ အပ်ဒိတ်လုပ်ရမည်၊ ပြန်လည်ရယူရမည်ကို တက်ကြွစွာ ဆုံးဖြတ်ခြင်း ပတ်ဝန်းကျင်နှင့် ပေါင်းစပ်ခြင်းပတ်ဝန်းကျင်နှင့် တိုက်ရိုက်အပြန်အလှန်ဆက်သွယ်မှုမရှိပတ်ဝန်းကျင်တုံ့ပြန်ချက်ကို နက်ရှိုင်းစွာ ပေါင်းစပ်ထားပြီး အပြန်အလှန်အကျိုးသက်ရောက်မှုရှိသော သင်ယူမှုကို ပံ့ပိုးပေးသည် အဓိကကွာခြားချက်- LLM မှတ်ဉာဏ်သည် အခြေခံအားဖြင့် တည်ငြိမ်သည် (ပါရာမီတာများ တည်ငြိမ်သည်) သို့မဟုတ် ခဏတာသာဖြစ်သည် (အကြောင်းအရာ ကန့်သတ်ထားသည်) ဖြစ်ပြီး ဉာဏ်ရည်တုမှတ်ဉာဏ်သည် တက်ကြွသည်၊ တာရှည်ခံသည်၊ ပတ်ဝန်းကျင်နှင့် ပေါင်းစပ်ထားသည် ဖြစ်သည်။
ဉာဏ်ရည်တုမှတ်ဉာဏ်နှင့် အကြောင်းအရာအင်ဂျင်နီယာ
အကြောင်းအရာအင်ဂျင်နီယာနှင့် သက်ဆိုင်သော နည်းပညာများ-
-
Tool-integrated reasoning- ReTool, ToolLLM, Toolformer, VTool-R1, ToRL
-
Tool selection- AutoTool, VisTA
-
Communication protocol- ANP, A2A, MCP, Agora
ရှုထောင့်အကြောင်းအရာအင်ဂျင်နီယာဉာဏ်ရည်တုမှတ်ဉာဏ် အာရုံစိုက်မှုတစ်ခုတည်းသော အလှည့်ကျ သို့မဟုတ် လက်ရှိလုပ်ငန်းတာဝန်အတွက် ထည့်သွင်းမှုကို အကောင်းဆုံးဖြစ်အောင်ပြုလုပ်ခြင်းအလှည့်အပြောင်းများစွာ၊ လုပ်ငန်းတာဝန်အများအပြားအတွက် သတင်းအချက်အလက်ကို တာရှည်ခံစေခြင်းနှင့် အသုံးချခြင်း အချိန်အတိုင်းအတာလက်ရှိဆွေးနွေးမှုရေရှည်သမိုင်း သတင်းအချက်အလက်ရွေးချယ်ခြင်းလူလုပ်ဒီဇိုင်း သို့မဟုတ် အလိုအလျောက်ဖြစ်ပေါ်ခြင်း၊ တိုးတက်ပြောင်းလဲခြင်း၊ ပြန်လည်ရယူခြင်းယန္တရားဆိုင်ရာ အလိုအလျောက်နည်းလမ်း အခြေအနေစီမံခန့်ခွဲမှုတာရှည်ခံသောအခြေအနေမရှိတိုးတက်ပြောင်းလဲနိုင်သော မှတ်ဉာဏ်အခြေအနေကို ထင်ရှားစွာ ထိန်းသိမ်းထားခြင်း အဓိကကွာခြားချက်- အကြောင်းအရာအင်ဂျင်နီယာသည် အချက်ပြအကောင်းဆုံးဖြစ်အောင်ပြုလုပ်သည့် နည်းပညာ ဖြစ်ပြီး ဉာဏ်ရည်တုမှတ်ဉာဏ်သည် အခြေအနေစီမံခန့်ခွဲမှုစနစ် ဖြစ်သည်။ ပထမတစ်ခုက "ယခုဘာထည့်သွင်းရမလဲ" ကိုအာရုံစိုက်ပြီး နောက်တစ်ခုက "အတိတ်ကဘာမှတ်မိလဲ၊ ယခုနှင့်အနာဂတ်ကို မည်သို့အကျိုးသက်ရောက်စေသနည်း" ကိုအာရုံစိုက်သည်။





