പാരാമീറ്ററുകൾ ക്രമീകരിക്കാതെ, കോഡ് മാത്രം എഴുതുക! ജെഫ് ക്ലൂൺ ടീമിന്റെ പുതിയ സൃഷ്ടി: മെറ്റാ ഏജന്റ് സ്വയം മെമ്മറി മൊഡ്യൂളുകൾ വികസിപ്പിക്കുന്നു

സോഫ്റ്റ്‌വെയർ 3.0 ലേക്കുള്ള വഴിയിൽ, AI സ്വന്തമായി പൈത്തൺ കോഡ് എഴുതി തലച്ചോറിനെ വികസിപ്പിക്കുന്നു.

ALMA

ഏജന്റ് വികസനത്തിന്റെ ആഴത്തിലുള്ള മേഖലകളിൽ, മെമ്മറി (Memory) എപ്പോഴും ഒഴിവാക്കാൻ പറ്റാത്ത ഒരു പ്രശ്നമാണ്.

അടിസ്ഥാന മോഡലുകളുടെ കഴിവുകൾ വർദ്ധിച്ചുവരികയാണെങ്കിലും, കാര്യങ്ങൾ മനസ്സിലാക്കുന്ന പ്രക്രിയയിൽ അവയുടെ സ്വഭാവം സ്റ്റേറ്റ്‌ലെസ്സ് (Stateless) ആണ്. ഇത് ഏജന്റിന് അനുഭവങ്ങൾ നേടുന്നതിൽ തടസ്സമുണ്ടാക്കുന്നു.

നിലവിൽ, മെമ്മറി കൈകാര്യം ചെയ്യാൻ വ്യവസായം ഉപയോഗിക്കുന്ന പ്രധാന രീതികളായ RAG ആയാലും സ്ലൈഡിംഗ് വിൻഡോ സംഗ്രഹങ്ങളായാലും, അവയെല്ലാം മനുഷ്യൻ രൂപകൽപ്പന ചെയ്ത ഹ്യൂറിസ്റ്റിക് നിയമങ്ങളിൽ (Heuristic rules) അടിസ്ഥാനമാക്കിയുള്ളവയാണ്.

ഇങ്ങനെ സ്വയം നിർമ്മിച്ച മെമ്മറി മൊഡ്യൂളുകൾ വളരെ ദുർബലവും മാറ്റാൻ പ്രയാസവുമാണ്. സംഭാഷണ സംവിധാനങ്ങൾക്കായി ശ്രദ്ധാപൂർവ്വം ക്രമീകരിച്ച പ്രോംപ്റ്റുകളും (Prompts) വീണ്ടെടുക്കൽ ലോജിക്കും (Retrieval logic), ദീർഘകാല ആസൂത്രണ ടാസ്‌ക്കുകളിലോ (ALFWorld പോലുള്ളവ) സങ്കീർണ്ണമായ സ്ട്രാറ്റജി ഗെയിമുകളിലോ ഉപയോഗിക്കുമ്പോൾ പലപ്പോഴും പരാജയപ്പെടുന്നു.

ALMA ആർക്കിടെക്ചർ

ഈ ബുദ്ധിമുട്ടിന് ഒരു പരിഹാരവുമായി എത്തിയിരിക്കുകയാണ് UBC പ്രൊഫസറും OpenAI-യുടെ മുൻ ഗവേഷകനുമായ ജെഫ് ക്ലൂൺ ടീം.

ഏത് തരത്തിലുള്ള മെമ്മറി ഘടനയാണ് മികച്ചതെന്ന് അറിയാത്തതുകൊണ്ട്, ഏജന്റ് തന്നെ പൈത്തൺ കോഡ് എഴുതി രൂപകൽപ്പന ചെയ്യാൻ അനുവദിക്കുക.

ഇതാണ് പുതുതായി പുറത്തിറങ്ങിയ ALMA (Automated meta-Learning of Memory designs for Agentic systems).

ADAS മുതൽ ALMA വരെ: കോഡ് അടിസ്ഥാനമാക്കിയുള്ള ഓട്ടോമേറ്റഡ് ഡിസൈൻ

ALMA എന്നത് ഈ ടീം അടുത്തകാലത്തായി പ്രോത്സാഹിപ്പിക്കുന്ന AI ജനറേറ്റീവ് അൽഗോരിതം സാങ്കേതികവിദ്യയുടെ തുടർച്ചയാണ്.

ADAS

ADAS (Automated Design of Agentic Systems) ഉപയോഗിച്ച്, ഒരു ഏജന്റ് ആർക്കിടെക്ചർ രൂപകൽപ്പന ചെയ്യുമ്പോൾ, ന്യൂറൽ നെറ്റ്‌വർക്ക് വെയ്റ്റുകളേക്കാളും (Neural Network weights) സോഫ്റ്റ് പ്രോംപ്റ്റുകളേക്കാളും (Soft Prompts) കൂടുതൽ കാര്യക്ഷമമായ സെർച്ച് സ്പേസ് (Search space) കോഡാണെന്ന് ടീം തെളിയിച്ചു. കോഡിന് ട്യൂറിംഗ് പൂർണ്ണതയുണ്ട് (Turing completeness), കൂടാതെ ഇത് വളരെ എളുപ്പത്തിൽ മനസ്സിലാക്കാവുന്നതുമാണ്.

മെറ്റാ ഏജന്റ്

തുടർന്ന്, DGM (Darwin Gödel Machine) ൽ, ടീം പരിണാമ അൽഗോരിതത്തിലെ (Evolutionary algorithm) ഓപ്പൺ-എൻഡഡ് എക്സ്പ്ലോറേഷൻ (Open-ended exploration) എന്ന ആശയം അവതരിപ്പിച്ചു. പുതിയ പരിഹാരങ്ങൾ കണ്ടെത്താൻ മോഡലിനെ പ്രോത്സാഹിപ്പിക്കുന്നതിനായി ഒരു ഡിസൈൻ ആർക്കൈവ് (Design archive) പരിപാലിക്കുന്നു.

DGM

ALMA, ADAS-ൻ്റെ കോഡ് ജനറേഷൻ മാതൃകയും (Code generation paradigm) DGM-ൻ്റെ പരിണാമ തന്ത്രവും (Evolution strategy) പിന്തുടരുന്നു. ഏജന്റ് സിസ്റ്റത്തിലെ ഏറ്റവും പ്രധാനപ്പെട്ട ഘടകമായ മെമ്മറിയുടെ ഉപയോഗ സാഹചര്യങ്ങളിൽ ശ്രദ്ധ കേന്ദ്രീകരിക്കുന്നു.

ALMA-യുടെ പ്രവർത്തനരീതി

ALMA-യുടെ പ്രവർത്തനരീതി ഒരു സാധാരണ മെറ്റാ ലേണിംഗ് ലൂപ്പാണ് (Meta-learning loop). മെറ്റാ ഏജന്റ് (Meta Agent) ടാസ്‌ക്കുകൾ നേരിട്ട് ചെയ്യുന്നതിന് പകരം കോഡിംഗ് ചെയ്യുന്നു. ഈ പ്രക്രിയയിൽ നാല് ഘട്ടങ്ങളുണ്ട്:

ആശയം: നിലവിലെ മെമ്മറി ഡിസൈൻ ആർക്കൈവ് വിശകലനം ചെയ്യുക, പഴയ പ്രകടനത്തെ അടിസ്ഥാനമാക്കി മെച്ചപ്പെടുത്താനുള്ള വഴികൾ കണ്ടെത്തുക.
ആസൂത്രണം: ആശയങ്ങളെ ക pseudo code ലോജിക്കിലേക്ക് മാറ്റുക.
നടപ്പിലാക്കുക: എക്സിക്യൂട്ടബിൾ പൈത്തൺ കോഡ് എഴുതുക, പ്രധാന ഫംഗ്ഷനുകൾ നിർവചിക്കുക.
വിലയിരുത്തുക: ജനറേറ്റ് ചെയ്ത കോഡ് ഒരു സാൻഡ്‌ബോക്സ് പരിതസ്ഥിതിയിൽ (Sandbox environment) പ്രവർത്തിപ്പിച്ച്, പ്രകടന സൂചകങ്ങളിൽ ഫീഡ്‌ബാക്ക് നൽകുക.

പ്രവർത്തനരീതി

പരിണാമ പ്രക്രിയയിൽ, ALMA ഒരു വലിയ ഡിസൈൻ ട്രീ (Design tree) ഉണ്ടാക്കുന്നു. ആവർത്തനങ്ങളുടെ എണ്ണം കൂടുന്തോറും, ജനറേറ്റ് ചെയ്യുന്ന മെമ്മറി കോഡ് ലളിതമായ സ്റ്റോറേജ് ലോജിക്കിൽ നിന്ന് (Storage logic) സങ്കീർണ്ണമായ കോഗ്നിറ്റീവ് ആർക്കിടെക്ചറായി (Cognitive architecture) മാറുന്നു.

പരിണാമ ട്രീ

വികസിപ്പിച്ചെടുത്ത മെമ്മറി ഘടന

ALMA ഉണ്ടാക്കിയ മെമ്മറി ഡിസൈനുകൾ ഓരോ ടാസ്‌ക്കുകളിലും വലിയ വ്യത്യാസങ്ങൾ കാണിച്ചു:

MiniHack (Dungeon Exploration): Risk and Interaction മൊഡ്യൂൾ രൂപകൽപ്പന ചെയ്തു, ഇത് രക്തം നഷ്ടപ്പെടുത്തുന്ന പ്രവർത്തനങ്ങളും രാക്ഷസന്മാരുടെ ആക്രമണോത്സുകതയും വ്യക്തമായി രേഖപ്പെടുത്തുന്നു.
Baba Is AI (Logic Puzzle): Strategy Library രൂപകൽപ്പന ചെയ്തു, ലെവലുകൾ കടന്നുപോകാൻ ആവശ്യമായ നിയമങ്ങളുടെ കോമ്പിനേഷനുകൾ രേഖപ്പെടുത്തുന്നു.

മെമ്മറി ഘടന

ഓരോ ടാസ്‌ക്കിന്റെയും പ്രത്യേകതകൾ തിരിച്ചറിയാൻ AI-ക്ക് കഴിയുമെന്നാണ് ഇത് കാണിക്കുന്നത്: അതിജീവന ഗെയിമുകൾ അപകടസാധ്യതകളിൽ ശ്രദ്ധ കേന്ദ്രീകരിക്കണം, പസിൽ ഗെയിമുകൾ നിയമങ്ങളുടെ സംഗ്രഹത്തിൽ ശ്രദ്ധിക്കണം.

പരീക്ഷണ ഫലങ്ങൾ

TextWorld, ALFWorld, MiniHack, Baba Is AI എന്നീ നാല് പരിതസ്ഥിതികളിൽ ALMA-യെ പ്രധാന അടിസ്ഥാനങ്ങളുമായി (Baselines) താരതമ്യം ചെയ്തു.

GPT-5-mini മോഡലിൽ, ALMA-യുടെ ശരാശരി വിജയ നിരക്ക് 53.9% ആണ്, ഇത് G-Memory (46.0%)യെക്കാളും Trajectory Retrieval (48.6%) നെക്കാളും മികച്ചതാണ്.

പരീക്ഷണ ഫലങ്ങൾ

ചെലവ് കുറഞ്ഞ കാര്യത്തിൽ, ALMA ശരാശരി 1,319 ടോക്കണുകൾ (tokens)മാത്രമേ ഉപയോഗിക്കുന്നുള്ളൂ, അതേസമയം Trajectory Retrieval 9,149 ടോക്കണുകളും G-Memory 6,055 ടോക്കണുകളും ഉപയോഗിക്കുന്നു. ഏകദേശം 1/7 മുതൽ 1/5 വരെ കുറഞ്ഞ ചിലവിൽ, ALMA മികച്ച പ്രകടനം കാഴ്ചവയ്ക്കുന്നു.

ചെലവ് കുറഞ്ഞ രീതി

ഉപസംഹാരം

സോഫ്റ്റ്‌വെയർ 2.0 (Neural Networks) ൽ നിന്ന് സോഫ്റ്റ്‌വെയർ 3.0 (AI-Generating Algorithms) ലേക്കുള്ള മാറ്റത്തിന്റെ സാധ്യത ALMA കാണിക്കുന്നു.

ഏജന്റ് വികസനത്തിൽ, മെമ്മറി മൊഡ്യൂളിന്റെ രൂപകൽപ്പന വളരെക്കാലമായി എഞ്ചിനീയർമാരുടെ സഹായത്തെ ആശ്രയിച്ചിരിക്കുന്നു. മെറ്റാ ലേണിംഗിലൂടെയും കോഡ് ജനറേഷനിലൂടെയും, AI-ക്ക് ഓരോ സാഹചര്യങ്ങൾക്കനുരിച്ച് ഏറ്റവും അനുയോജ്യമായ മെമ്മറി ആർക്കിടെക്ചർ സ്വയം കണ്ടെത്താൻ കഴിയുമെന്ന് ALMA തെളിയിക്കുന്നു.

ഉറവിട ലിങ്കുകൾ

പ്രബന്ധം: https://arxiv.org/pdf/2602.07755
കോഡ്: https://github.com/zksha/alma
പ്രോജക്റ്റ് ഹോംപേജ്: https://yimingxiong.me/alma

ADAS മുതൽ ALMA വരെ: കോഡ് അടിസ്ഥാനമാക്കിയുള്ള ഓട്ടോമേറ്റഡ് ഡിസൈൻ

ALMA-യുടെ പ്രവർത്തനരീതി

വികസിപ്പിച്ചെടുത്ത മെമ്മറി ഘടന

പരീക്ഷണ ഫലങ്ങൾ

ഉപസംഹാരം

ഉറവിട ലിങ്കുകൾ

You Might Also Like

Claude Code Buddy മാറ്റം മാർഗ്ഗനിർദ്ദേശം: എങ്ങനെ മിനുക്കിയ പാരമ്പര്യതലത്തെ പെട്ടി നേടാം

Obsidian Defuddle പുറത്തിറക്കി, Obsidian Web Clipper-നെ പുതിയ ഉയരത്തിലേക്ക് കൊണ്ടുപോയി

2026, ഇനി സ്വയം 'ആത്മനിർവഹണം' ചെയ്യാൻ സമ്മർദം നൽകേണ്ട! ഈ 8 ചെറിയ കാര്യങ്ങൾ ചെയ്യുക, ആരോഗ്യവും സ്വാഭാവികമായി വരും

അവിടെ കുറവായിട്ടും കുറയാത്ത അമ്മമാർ, അവരെ ഇവിടെ കാണാം

AI Browser 24 മണിക്കൂർ സ്ഥിരമായ പ്രവർത്തന മാർഗ്ഗനിർദ്ദേശം