പാരാമീറ്ററുകൾ ക്രമീകരിക്കാതെ, കോഡ് മാത്രം എഴുതുക! ജെഫ് ക്ലൂൺ ടീമിന്റെ പുതിയ സൃഷ്ടി: മെറ്റാ ഏജന്റ് സ്വയം മെമ്മറി മൊഡ്യൂളുകൾ വികസിപ്പിക്കുന്നു
പാരാമീറ്ററുകൾ ക്രമീകരിക്കാതെ, കോഡ് മാത്രം എഴുതുക! ജെഫ് ക്ലൂൺ ടീമിന്റെ പുതിയ സൃഷ്ടി: മെറ്റാ ഏജന്റ് സ്വയം മെമ്മറി മൊഡ്യൂളുകൾ വികസിപ്പിക്കുന്നു
സോഫ്റ്റ്വെയർ 3.0 ലേക്കുള്ള വഴിയിൽ, AI സ്വന്തമായി പൈത്തൺ കോഡ് എഴുതി തലച്ചോറിനെ വികസിപ്പിക്കുന്നു.

ഏജന്റ് വികസനത്തിന്റെ ആഴത്തിലുള്ള മേഖലകളിൽ, മെമ്മറി (Memory) എപ്പോഴും ഒഴിവാക്കാൻ പറ്റാത്ത ഒരു പ്രശ്നമാണ്.
അടിസ്ഥാന മോഡലുകളുടെ കഴിവുകൾ വർദ്ധിച്ചുവരികയാണെങ്കിലും, കാര്യങ്ങൾ മനസ്സിലാക്കുന്ന പ്രക്രിയയിൽ അവയുടെ സ്വഭാവം സ്റ്റേറ്റ്ലെസ്സ് (Stateless) ആണ്. ഇത് ഏജന്റിന് അനുഭവങ്ങൾ നേടുന്നതിൽ തടസ്സമുണ്ടാക്കുന്നു.
നിലവിൽ, മെമ്മറി കൈകാര്യം ചെയ്യാൻ വ്യവസായം ഉപയോഗിക്കുന്ന പ്രധാന രീതികളായ RAG ആയാലും സ്ലൈഡിംഗ് വിൻഡോ സംഗ്രഹങ്ങളായാലും, അവയെല്ലാം മനുഷ്യൻ രൂപകൽപ്പന ചെയ്ത ഹ്യൂറിസ്റ്റിക് നിയമങ്ങളിൽ (Heuristic rules) അടിസ്ഥാനമാക്കിയുള്ളവയാണ്.
ഇങ്ങനെ സ്വയം നിർമ്മിച്ച മെമ്മറി മൊഡ്യൂളുകൾ വളരെ ദുർബലവും മാറ്റാൻ പ്രയാസവുമാണ്. സംഭാഷണ സംവിധാനങ്ങൾക്കായി ശ്രദ്ധാപൂർവ്വം ക്രമീകരിച്ച പ്രോംപ്റ്റുകളും (Prompts) വീണ്ടെടുക്കൽ ലോജിക്കും (Retrieval logic), ദീർഘകാല ആസൂത്രണ ടാസ്ക്കുകളിലോ (ALFWorld പോലുള്ളവ) സങ്കീർണ്ണമായ സ്ട്രാറ്റജി ഗെയിമുകളിലോ ഉപയോഗിക്കുമ്പോൾ പലപ്പോഴും പരാജയപ്പെടുന്നു.

ഈ ബുദ്ധിമുട്ടിന് ഒരു പരിഹാരവുമായി എത്തിയിരിക്കുകയാണ് UBC പ്രൊഫസറും OpenAI-യുടെ മുൻ ഗവേഷകനുമായ ജെഫ് ക്ലൂൺ ടീം.
ഏത് തരത്തിലുള്ള മെമ്മറി ഘടനയാണ് മികച്ചതെന്ന് അറിയാത്തതുകൊണ്ട്, ഏജന്റ് തന്നെ പൈത്തൺ കോഡ് എഴുതി രൂപകൽപ്പന ചെയ്യാൻ അനുവദിക്കുക.
ഇതാണ് പുതുതായി പുറത്തിറങ്ങിയ ALMA (Automated meta-Learning of Memory designs for Agentic systems).
ADAS മുതൽ ALMA വരെ: കോഡ് അടിസ്ഥാനമാക്കിയുള്ള ഓട്ടോമേറ്റഡ് ഡിസൈൻ
ALMA എന്നത് ഈ ടീം അടുത്തകാലത്തായി പ്രോത്സാഹിപ്പിക്കുന്ന AI ജനറേറ്റീവ് അൽഗോരിതം സാങ്കേതികവിദ്യയുടെ തുടർച്ചയാണ്.

ADAS (Automated Design of Agentic Systems) ഉപയോഗിച്ച്, ഒരു ഏജന്റ് ആർക്കിടെക്ചർ രൂപകൽപ്പന ചെയ്യുമ്പോൾ, ന്യൂറൽ നെറ്റ്വർക്ക് വെയ്റ്റുകളേക്കാളും (Neural Network weights) സോഫ്റ്റ് പ്രോംപ്റ്റുകളേക്കാളും (Soft Prompts) കൂടുതൽ കാര്യക്ഷമമായ സെർച്ച് സ്പേസ് (Search space) കോഡാണെന്ന് ടീം തെളിയിച്ചു. കോഡിന് ട്യൂറിംഗ് പൂർണ്ണതയുണ്ട് (Turing completeness), കൂടാതെ ഇത് വളരെ എളുപ്പത്തിൽ മനസ്സിലാക്കാവുന്നതുമാണ്.

തുടർന്ന്, DGM (Darwin Gödel Machine) ൽ, ടീം പരിണാമ അൽഗോരിതത്തിലെ (Evolutionary algorithm) ഓപ്പൺ-എൻഡഡ് എക്സ്പ്ലോറേഷൻ (Open-ended exploration) എന്ന ആശയം അവതരിപ്പിച്ചു. പുതിയ പരിഹാരങ്ങൾ കണ്ടെത്താൻ മോഡലിനെ പ്രോത്സാഹിപ്പിക്കുന്നതിനായി ഒരു ഡിസൈൻ ആർക്കൈവ് (Design archive) പരിപാലിക്കുന്നു.

ALMA, ADAS-ൻ്റെ കോഡ് ജനറേഷൻ മാതൃകയും (Code generation paradigm) DGM-ൻ്റെ പരിണാമ തന്ത്രവും (Evolution strategy) പിന്തുടരുന്നു. ഏജന്റ് സിസ്റ്റത്തിലെ ഏറ്റവും പ്രധാനപ്പെട്ട ഘടകമായ മെമ്മറിയുടെ ഉപയോഗ സാഹചര്യങ്ങളിൽ ശ്രദ്ധ കേന്ദ്രീകരിക്കുന്നു.
ALMA-യുടെ പ്രവർത്തനരീതി
ALMA-യുടെ പ്രവർത്തനരീതി ഒരു സാധാരണ മെറ്റാ ലേണിംഗ് ലൂപ്പാണ് (Meta-learning loop). മെറ്റാ ഏജന്റ് (Meta Agent) ടാസ്ക്കുകൾ നേരിട്ട് ചെയ്യുന്നതിന് പകരം കോഡിംഗ് ചെയ്യുന്നു. ഈ പ്രക്രിയയിൽ നാല് ഘട്ടങ്ങളുണ്ട്:
- ആശയം: നിലവിലെ മെമ്മറി ഡിസൈൻ ആർക്കൈവ് വിശകലനം ചെയ്യുക, പഴയ പ്രകടനത്തെ അടിസ്ഥാനമാക്കി മെച്ചപ്പെടുത്താനുള്ള വഴികൾ കണ്ടെത്തുക.
- ആസൂത്രണം: ആശയങ്ങളെ ക pseudo code ലോജിക്കിലേക്ക് മാറ്റുക.
- നടപ്പിലാക്കുക: എക്സിക്യൂട്ടബിൾ പൈത്തൺ കോഡ് എഴുതുക, പ്രധാന ഫംഗ്ഷനുകൾ നിർവചിക്കുക.
- വിലയിരുത്തുക: ജനറേറ്റ് ചെയ്ത കോഡ് ഒരു സാൻഡ്ബോക്സ് പരിതസ്ഥിതിയിൽ (Sandbox environment) പ്രവർത്തിപ്പിച്ച്, പ്രകടന സൂചകങ്ങളിൽ ഫീഡ്ബാക്ക് നൽകുക.

പരിണാമ പ്രക്രിയയിൽ, ALMA ഒരു വലിയ ഡിസൈൻ ട്രീ (Design tree) ഉണ്ടാക്കുന്നു. ആവർത്തനങ്ങളുടെ എണ്ണം കൂടുന്തോറും, ജനറേറ്റ് ചെയ്യുന്ന മെമ്മറി കോഡ് ലളിതമായ സ്റ്റോറേജ് ലോജിക്കിൽ നിന്ന് (Storage logic) സങ്കീർണ്ണമായ കോഗ്നിറ്റീവ് ആർക്കിടെക്ചറായി (Cognitive architecture) മാറുന്നു.

വികസിപ്പിച്ചെടുത്ത മെമ്മറി ഘടന
ALMA ഉണ്ടാക്കിയ മെമ്മറി ഡിസൈനുകൾ ഓരോ ടാസ്ക്കുകളിലും വലിയ വ്യത്യാസങ്ങൾ കാണിച്ചു:
- MiniHack (Dungeon Exploration): Risk and Interaction മൊഡ്യൂൾ രൂപകൽപ്പന ചെയ്തു, ഇത് രക്തം നഷ്ടപ്പെടുത്തുന്ന പ്രവർത്തനങ്ങളും രാക്ഷസന്മാരുടെ ആക്രമണോത്സുകതയും വ്യക്തമായി രേഖപ്പെടുത്തുന്നു.
- Baba Is AI (Logic Puzzle): Strategy Library രൂപകൽപ്പന ചെയ്തു, ലെവലുകൾ കടന്നുപോകാൻ ആവശ്യമായ നിയമങ്ങളുടെ കോമ്പിനേഷനുകൾ രേഖപ്പെടുത്തുന്നു.

ഓരോ ടാസ്ക്കിന്റെയും പ്രത്യേകതകൾ തിരിച്ചറിയാൻ AI-ക്ക് കഴിയുമെന്നാണ് ഇത് കാണിക്കുന്നത്: അതിജീവന ഗെയിമുകൾ അപകടസാധ്യതകളിൽ ശ്രദ്ധ കേന്ദ്രീകരിക്കണം, പസിൽ ഗെയിമുകൾ നിയമങ്ങളുടെ സംഗ്രഹത്തിൽ ശ്രദ്ധിക്കണം.
പരീക്ഷണ ഫലങ്ങൾ
TextWorld, ALFWorld, MiniHack, Baba Is AI എന്നീ നാല് പരിതസ്ഥിതികളിൽ ALMA-യെ പ്രധാന അടിസ്ഥാനങ്ങളുമായി (Baselines) താരതമ്യം ചെയ്തു.
GPT-5-mini മോഡലിൽ, ALMA-യുടെ ശരാശരി വിജയ നിരക്ക് 53.9% ആണ്, ഇത് G-Memory (46.0%)യെക്കാളും Trajectory Retrieval (48.6%) നെക്കാളും മികച്ചതാണ്.

ചെലവ് കുറഞ്ഞ കാര്യത്തിൽ, ALMA ശരാശരി 1,319 ടോക്കണുകൾ (tokens)മാത്രമേ ഉപയോഗിക്കുന്നുള്ളൂ, അതേസമയം Trajectory Retrieval 9,149 ടോക്കണുകളും G-Memory 6,055 ടോക്കണുകളും ഉപയോഗിക്കുന്നു. ഏകദേശം 1/7 മുതൽ 1/5 വരെ കുറഞ്ഞ ചിലവിൽ, ALMA മികച്ച പ്രകടനം കാഴ്ചവയ്ക്കുന്നു.

ഉപസംഹാരം
സോഫ്റ്റ്വെയർ 2.0 (Neural Networks) ൽ നിന്ന് സോഫ്റ്റ്വെയർ 3.0 (AI-Generating Algorithms) ലേക്കുള്ള മാറ്റത്തിന്റെ സാധ്യത ALMA കാണിക്കുന്നു.
ഏജന്റ് വികസനത്തിൽ, മെമ്മറി മൊഡ്യൂളിന്റെ രൂപകൽപ്പന വളരെക്കാലമായി എഞ്ചിനീയർമാരുടെ സഹായത്തെ ആശ്രയിച്ചിരിക്കുന്നു. മെറ്റാ ലേണിംഗിലൂടെയും കോഡ് ജനറേഷനിലൂടെയും, AI-ക്ക് ഓരോ സാഹചര്യങ്ങൾക്കനുരിച്ച് ഏറ്റവും അനുയോജ്യമായ മെമ്മറി ആർക്കിടെക്ചർ സ്വയം കണ്ടെത്താൻ കഴിയുമെന്ന് ALMA തെളിയിക്കുന്നു.
ഉറവിട ലിങ്കുകൾ
- പ്രബന്ധം: https://arxiv.org/pdf/2602.07755
- കോഡ്: https://github.com/zksha/alma
- പ്രോജക്റ്റ് ഹോംപേജ്: https://yimingxiong.me/alma





