Parameter ချိန်ညှိစရာမလို၊ ကုဒ်ရေးရုံပဲ! Jeff Clune အဖွဲ့ရဲ့ နောက်ဆုံးထွက်- Meta Agent က မှတ်ဉာဏ် module ကို အလိုအလျောက် ဆင့်ကဲပြောင်းလဲစေ
Parameter ချိန်ညှိစရာမလို၊ ကုဒ်ရေးရုံပဲ! Jeff Clune အဖွဲ့ရဲ့ နောက်ဆုံးထွက်- Meta Agent က မှတ်ဉာဏ် module ကို အလိုအလျောက် ဆင့်ကဲပြောင်းလဲစေ
Software 3.0 ဆီသို့ ဦးတည်ရင်း AI က Python ကုဒ်ကို သူ့ဘာသာရေးပြီး ဦးနှောက်ကို ဆင့်ကဲပြောင်းလဲနေပါပြီ။

Agent တည်ဆောက်ရေးရဲ့ နက်ရှိုင်းတဲ့အပိုင်းမှာ မှတ်ဉာဏ် (Memory) ဟာ ရှောင်လွှဲလို့မရတဲ့ အခက်အခဲတစ်ခုအဖြစ် အမြဲရှိနေပါတယ်။
အခြေခံ model တွေရဲ့ စွမ်းဆောင်ရည်တွေ တိုးတက်လာပေမယ့် ယုတ္တိဗေဒ လုပ်ဆောင်တဲ့အခါမှာ Stateless ဖြစ်နေတာက Agent တွေရဲ့ အတွေ့အကြုံတွေကို စဉ်ဆက်မပြတ် စုဆောင်းနိုင်စွမ်းကို ကန့်သတ်ထားပါတယ်။
လက်ရှိလုပ်ငန်းနယ်ပယ်မှာ မှတ်ဉာဏ်ကို ကိုင်တွယ်ဖြေရှင်းတဲ့ နည်းလမ်းတွေဖြစ်တဲ့ RAG (Retrieval-Augmented Generation) သို့မဟုတ် Sliding Window အနှစ်ချုပ်တွေဟာ လူကိုယ်တိုင် ဒီဇိုင်းထုတ်ထားတဲ့ Heuristic စည်းမျဉ်းတွေအပေါ်မှာပဲ အခြေခံနေပါသေးတယ်။
ဒီလိုမျိုး လက်နဲ့လုပ်ထားတဲ့ မှတ်ဉာဏ် module တွေဟာ အလွန်အားနည်းပြီး ရွှေ့ပြောင်းဖို့ခက်ခဲပါတယ်။ Dialogue system တွေအတွက် ဂရုတစိုက် ချိန်ညှိထားတဲ့ Prompt တွေနဲ့ ရှာဖွေရေးယုတ္တိဗေဒတွေဟာ Long-range planning task (ဥပမာ ALFWorld) ဒါမှမဟုတ် ရှုပ်ထွေးတဲ့ မဟာဗျူဟာဂိမ်းတွေမှာ ထည့်လိုက်တာနဲ့ ချက်ချင်း အလုပ်မလုပ်တော့ပါဘူး။

ဒီအခက်အခဲကို ဖြေရှင်းဖို့ UBC ပါမောက္ခနဲ့ OpenAI ရဲ့ သုတေသီဟောင်း Jeff Clune အဖွဲ့က Geek ဆန်ဆန် ဖြေရှင်းနည်းကို ပေးထားပါတယ်။
ဘယ်လို မှတ်ဉာဏ်ဖွဲ့စည်းပုံက အကောင်းဆုံးလဲဆိုတာ မသိရင် Agent ကိုယ်တိုင် Python ကုဒ်ရေးပြီး ဒီဇိုင်းဆွဲခိုင်းလိုက်ပါ။
ဒါက မကြာသေးခင်က ထုတ်ပြန်ခဲ့တဲ့ ALMA (Automated meta-Learning of Memory designs for Agentic systems) ပါ။
ADAS မှ ALMA သို့- ကုဒ်အခြေခံ အလိုအလျောက် ဒီဇိုင်း
ALMA ဟာ ဒီအဖွဲ့က မကြာသေးခင်က မြှင့်တင်ခဲ့တဲ့ AI ထုတ်လုပ်ရေး algorithm နည်းပညာလမ်းကြောင်းရဲ့ နောက်ဆက်တွဲပါ။

ADAS (Automated Design of Agentic Systems) မှာ Agent ဗိသုကာကို ဒီဇိုင်းဆွဲတဲ့အခါ ကုဒ်ဟာ Neural network weight တွေ ဒါမှမဟုတ် Soft Prompt တွေထက် ပိုထိရောက်တဲ့ ရှာဖွေရေးနယ်ပယ်ဖြစ်ကြောင်း သက်သေပြခဲ့ပါတယ်။ ကုဒ်မှာ Turing ပြည့်စုံမှုရှိပြီး အလွန်ရှင်းလင်းပြတ်သားတဲ့ သဘောသဘာဝလည်းရှိပါတယ်။

နောက်ပိုင်းမှာ DGM (Darwin Gödel Machine) မှာ ဒီအဖွဲ့က ဆင့်ကဲ algorithm ထဲက Open-ended exploration သဘောတရားကို မိတ်ဆက်ပေးခဲ့ပြီး ဒီဇိုင်းမှတ်တမ်းရုံးကို ထိန်းသိမ်းထားကာ model ကို ဆန်းသစ်တဲ့ ဖြေရှင်းနည်းတွေကို ရှာဖွေဖို့ အားပေးခဲ့ပါတယ်။

ALMA ဟာ ADAS ရဲ့ ကုဒ်ထုတ်လုပ်ရေးပုံစံနဲ့ DGM ရဲ့ ဆင့်ကဲဗျူဟာကို အမွေဆက်ခံထားပြီး လူ့အတွေ့အကြုံကို အားအကိုးဆုံးအစိတ်အပိုင်းဖြစ်တဲ့ မှတ်ဉာဏ်ကို Agent system မှာ အာရုံစိုက်ထားပါတယ်။
ALMA ရဲ့ လုပ်ဆောင်ပုံ
ALMA ရဲ့ လည်ပတ်မှုယန္တရားဟာ ပုံမှန် Meta-learning loop တစ်ခုပါ။ Meta Agent ဟာ task တွေကို တိုက်ရိုက်ကိုင်တွယ်မယ့်အစား programming ကို တာဝန်ယူပါတယ်။ လုပ်ငန်းစဉ်မှာ အဆင့်လေးဆင့်ပါဝင်ပါတယ်-
- စိတ်ကူး- လက်ရှိမှတ်ဉာဏ်ဒီဇိုင်းမှတ်တမ်းကို ခွဲခြမ်းစိတ်ဖြာပြီး သမိုင်းမှတ်တမ်းအပေါ်အခြေခံပြီး တိုးတက်မှုအစီအစဉ်ကို စိတ်ကူးပါ။
- စီမံချက်- စိတ်ကူးကို Pseudo-code ယုတ္တိဗေဒအဖြစ် ပြောင်းလဲပါ။
- အကောင်အထည်ဖော်- အဓိက function တွေကို သတ်မှတ်ပြီး လုပ်ဆောင်နိုင်တဲ့ Python ကုဒ်ကို ရေးပါ။
- အကဲဖြတ်- ထုတ်လုပ်ထားတဲ့ ကုဒ်ကို Sandbox ပတ်ဝန်းကျင်မှာ ထည့်သွင်းပြီး task တွေကို လုပ်ဆောင်ကာ စွမ်းဆောင်ရည်ညွှန်းကိန်းတွေကို တုံ့ပြန်ပါ။

ဆင့်ကဲဖြစ်စဉ်မှာ ALMA က ကြီးမားတဲ့ ဒီဇိုင်းသစ်ပင်ကို ထုတ်လုပ်ပေးပါလိမ့်မယ်။ Iteration အရေအတွက် တိုးလာတာနဲ့အမျှ ထုတ်လုပ်ထားတဲ့ မှတ်ဉာဏ်ကုဒ်ဟာ ရိုးရှင်းတဲ့ သိုလှောင်မှုယုတ္တိဗေဒကနေ ရှုပ်ထွေးတဲ့ သိမြင်မှုဗိသုကာအဖြစ် တဖြည်းဖြည်း ဆင့်ကဲပြောင်းလဲသွားပါတယ်။

ဆင့်ကဲပြောင်းလဲလာတဲ့ မှတ်ဉာဏ်ဖွဲ့စည်းပုံ
ALMA က ထုတ်လုပ်ထားတဲ့ မှတ်ဉာဏ်ဒီဇိုင်းဟာ မတူညီတဲ့ task တွေမှာ ကြီးမားတဲ့ ကွဲပြားခြားနားမှုတွေကို ပြသထားပါတယ်-
- MiniHack (မြေအောက်ခန်းစွန့်စားခန်း)- Risk and Interaction module ကို ဒီဇိုင်းဆွဲပြီး သွေးထွက်စေတဲ့ လုပ်ဆောင်ချက်တွေနဲ့ မိစ္ဆာကောင်တွေရဲ့ ရန်လိုမှုကို ရှင်းရှင်းလင်းလင်း မှတ်တမ်းတင်ထားပါတယ်။
- Baba Is AI (ယုတ္တိဗေဒပဟေဠိ)- Strategy Library ကို ဒီဇိုင်းဆွဲပြီး အဆင့်တွေကို ဖြတ်ကျော်ဖို့ လိုအပ်တဲ့ စည်းမျဉ်းပေါင်းစပ်မှုတွေကို မှတ်တမ်းတင်ထားပါတယ်။

ဒါက AI က task ရဲ့ လက္ခဏာတွေကို သိရှိနိုင်တယ်ဆိုတာကို ဖော်ပြနေပါတယ်- အသက်ရှင်ရပ်တည်ရေးဂိမ်းတွေက အန္တရာယ်ကို အာရုံစိုက်ဖို့လိုပြီး ပဟေဠိဂိမ်းတွေက စည်းမျဉ်းတွေကို အကျဉ်းချုပ်ဖို့ လိုအပ်ပါတယ်။
စမ်းသပ်မှုရလဒ်များ
TextWorld, ALFWorld, MiniHack, Baba Is AI ဆိုတဲ့ ပတ်ဝန်းကျင်လေးခုမှာ ALMA နဲ့ အဓိက အခြေခံလိုင်းတွေကို နှိုင်းယှဉ်ခဲ့ပါတယ်။
GPT-5-mini model မှာ ALMA ရဲ့ ပျမ်းမျှအောင်မြင်မှုနှုန်းက 53.9% အထိရှိပြီး G-Memory (46.0%) နဲ့ Trajectory Retrieval (48.6%) ထက် သာလွန်ပါတယ်။

ကုန်ကျစရိတ်သက်သာမှုအပိုင်းမှာ ALMA က ပျမ်းမျှ 1,319 tokens သာ သုံးစွဲပြီး Trajectory Retrieval က 9,149 tokens အထိ သုံးစွဲကာ G-Memory ကလည်း 6,055 tokens အထိ ရှိပါတယ်။ ALMA က 1/7 ကနေ 1/5 သာ ကုန်ကျပြီး ပိုကောင်းတဲ့ စွမ်းဆောင်ရည်ကို ရယူနိုင်ပါတယ်။

နိဂုံး
ALMA က Software 2.0 (Neural Networks) ကနေ Software 3.0 (AI-Generating Algorithms) ဆီကို ကူးပြောင်းနိုင်တဲ့ ဖြစ်နိုင်ခြေကို ပြသထားပါတယ်။
Agent တည်ဆောက်ရေးမှာ မှတ်ဉာဏ် module ရဲ့ ဒီဇိုင်းဟာ အင်ဂျင်နီယာတွေရဲ့ ဗီဇအတိုင်း သိတဲ့အပေါ်မှာ အချိန်အတော်ကြာ မှီခိုနေခဲ့ပါတယ်။ ALMA က Meta-learning နဲ့ ကုဒ်ထုတ်လုပ်ခြင်းအားဖြင့် AI ဟာ သီးခြားပတ်ဝန်းကျင်အပေါ်မူတည်ပြီး အကောင်းဆုံး မှတ်ဉာဏ်ဗိသုကာကို အလိုအလျောက် ရှာဖွေနိုင်ကြောင်း သက်သေပြခဲ့ပါတယ်။
အရင်းအမြစ်လင့်ခ်များ
- စာတမ်း- https://arxiv.org/pdf/2602.07755
- ကုဒ်- https://github.com/zksha/alma
- ပရောဂျက်ပင်မစာမျက်နှာ- https://yimingxiong.me/alma





