പാരാമീറ്ററുകൾ ക്രമീകരിക്കാതെ, കോഡ് മാത്രം എഴുതുക! ജെഫ് ക്ലൂൺ ടീമിന്റെ പുതിയ സൃഷ്ടി: മെറ്റാ ഏജന്റ് സ്വയം മെമ്മറി മൊഡ്യൂളുകൾ വികസിപ്പിക്കുന്നു

2/14/2026
3 min read

പാരാമീറ്ററുകൾ ക്രമീകരിക്കാതെ, കോഡ് മാത്രം എഴുതുക! ജെഫ് ക്ലൂൺ ടീമിന്റെ പുതിയ സൃഷ്ടി: മെറ്റാ ഏജന്റ് സ്വയം മെമ്മറി മൊഡ്യൂളുകൾ വികസിപ്പിക്കുന്നു

സോഫ്റ്റ്‌വെയർ 3.0 ലേക്കുള്ള വഴിയിൽ, AI സ്വന്തമായി പൈത്തൺ കോഡ് എഴുതി തലച്ചോറിനെ വികസിപ്പിക്കുന്നു.

ALMA

ഏജന്റ് വികസനത്തിന്റെ ആഴത്തിലുള്ള മേഖലകളിൽ, മെമ്മറി (Memory) എപ്പോഴും ഒഴിവാക്കാൻ പറ്റാത്ത ഒരു പ്രശ്നമാണ്.

അടിസ്ഥാന മോഡലുകളുടെ കഴിവുകൾ വർദ്ധിച്ചുവരികയാണെങ്കിലും, കാര്യങ്ങൾ മനസ്സിലാക്കുന്ന പ്രക്രിയയിൽ അവയുടെ സ്വഭാവം സ്റ്റേറ്റ്‌ലെസ്സ് (Stateless) ആണ്. ഇത് ഏജന്റിന് അനുഭവങ്ങൾ നേടുന്നതിൽ തടസ്സമുണ്ടാക്കുന്നു.

നിലവിൽ, മെമ്മറി കൈകാര്യം ചെയ്യാൻ വ്യവസായം ഉപയോഗിക്കുന്ന പ്രധാന രീതികളായ RAG ആയാലും സ്ലൈഡിംഗ് വിൻഡോ സംഗ്രഹങ്ങളായാലും, അവയെല്ലാം മനുഷ്യൻ രൂപകൽപ്പന ചെയ്ത ഹ്യൂറിസ്റ്റിക് നിയമങ്ങളിൽ (Heuristic rules) അടിസ്ഥാനമാക്കിയുള്ളവയാണ്.

ഇങ്ങനെ സ്വയം നിർമ്മിച്ച മെമ്മറി മൊഡ്യൂളുകൾ വളരെ ദുർബലവും മാറ്റാൻ പ്രയാസവുമാണ്. സംഭാഷണ സംവിധാനങ്ങൾക്കായി ശ്രദ്ധാപൂർവ്വം ക്രമീകരിച്ച പ്രോംപ്റ്റുകളും (Prompts) വീണ്ടെടുക്കൽ ലോജിക്കും (Retrieval logic), ദീർഘകാല ആസൂത്രണ ടാസ്‌ക്കുകളിലോ (ALFWorld പോലുള്ളവ) സങ്കീർണ്ണമായ സ്ട്രാറ്റജി ഗെയിമുകളിലോ ഉപയോഗിക്കുമ്പോൾ പലപ്പോഴും പരാജയപ്പെടുന്നു.

ALMA ആർക്കിടെക്ചർ

ഈ ബുദ്ധിമുട്ടിന് ഒരു പരിഹാരവുമായി എത്തിയിരിക്കുകയാണ് UBC പ്രൊഫസറും OpenAI-യുടെ മുൻ ഗവേഷകനുമായ ജെഫ് ക്ലൂൺ ടീം.

ഏത് തരത്തിലുള്ള മെമ്മറി ഘടനയാണ് മികച്ചതെന്ന് അറിയാത്തതുകൊണ്ട്, ഏജന്റ് തന്നെ പൈത്തൺ കോഡ് എഴുതി രൂപകൽപ്പന ചെയ്യാൻ അനുവദിക്കുക.

ഇതാണ് പുതുതായി പുറത്തിറങ്ങിയ ALMA (Automated meta-Learning of Memory designs for Agentic systems).

ADAS മുതൽ ALMA വരെ: കോഡ് അടിസ്ഥാനമാക്കിയുള്ള ഓട്ടോമേറ്റഡ് ഡിസൈൻ

ALMA എന്നത് ഈ ടീം അടുത്തകാലത്തായി പ്രോത്സാഹിപ്പിക്കുന്ന AI ജനറേറ്റീവ് അൽഗോരിതം സാങ്കേതികവിദ്യയുടെ തുടർച്ചയാണ്.

ADAS

ADAS (Automated Design of Agentic Systems) ഉപയോഗിച്ച്, ഒരു ഏജന്റ് ആർക്കിടെക്ചർ രൂപകൽപ്പന ചെയ്യുമ്പോൾ, ന്യൂറൽ നെറ്റ്‌വർക്ക് വെയ്റ്റുകളേക്കാളും (Neural Network weights) സോഫ്റ്റ് പ്രോംപ്റ്റുകളേക്കാളും (Soft Prompts) കൂടുതൽ കാര്യക്ഷമമായ സെർച്ച് സ്പേസ് (Search space) കോഡാണെന്ന് ടീം തെളിയിച്ചു. കോഡിന് ട്യൂറിംഗ് പൂർണ്ണതയുണ്ട് (Turing completeness), കൂടാതെ ഇത് വളരെ എളുപ്പത്തിൽ മനസ്സിലാക്കാവുന്നതുമാണ്.

മെറ്റാ ഏജന്റ്

തുടർന്ന്, DGM (Darwin Gödel Machine) ൽ, ടീം പരിണാമ അൽഗോരിതത്തിലെ (Evolutionary algorithm) ഓപ്പൺ-എൻഡഡ് എക്സ്പ്ലോറേഷൻ (Open-ended exploration) എന്ന ആശയം അവതരിപ്പിച്ചു. പുതിയ പരിഹാരങ്ങൾ കണ്ടെത്താൻ മോഡലിനെ പ്രോത്സാഹിപ്പിക്കുന്നതിനായി ഒരു ഡിസൈൻ ആർക്കൈവ് (Design archive) പരിപാലിക്കുന്നു.

DGM

ALMA, ADAS-ൻ്റെ കോഡ് ജനറേഷൻ മാതൃകയും (Code generation paradigm) DGM-ൻ്റെ പരിണാമ തന്ത്രവും (Evolution strategy) പിന്തുടരുന്നു. ഏജന്റ് സിസ്റ്റത്തിലെ ഏറ്റവും പ്രധാനപ്പെട്ട ഘടകമായ മെമ്മറിയുടെ ഉപയോഗ സാഹചര്യങ്ങളിൽ ശ്രദ്ധ കേന്ദ്രീകരിക്കുന്നു.

ALMA-യുടെ പ്രവർത്തനരീതി

ALMA-യുടെ പ്രവർത്തനരീതി ഒരു സാധാരണ മെറ്റാ ലേണിംഗ് ലൂപ്പാണ് (Meta-learning loop). മെറ്റാ ഏജന്റ് (Meta Agent) ടാസ്‌ക്കുകൾ നേരിട്ട് ചെയ്യുന്നതിന് പകരം കോഡിംഗ് ചെയ്യുന്നു. ഈ പ്രക്രിയയിൽ നാല് ഘട്ടങ്ങളുണ്ട്:

  • ആശയം: നിലവിലെ മെമ്മറി ഡിസൈൻ ആർക്കൈവ് വിശകലനം ചെയ്യുക, പഴയ പ്രകടനത്തെ അടിസ്ഥാനമാക്കി മെച്ചപ്പെടുത്താനുള്ള വഴികൾ കണ്ടെത്തുക.
  • ആസൂത്രണം: ആശയങ്ങളെ ക pseudo code ലോജിക്കിലേക്ക് മാറ്റുക.
  • നടപ്പിലാക്കുക: എക്സിക്യൂട്ടബിൾ പൈത്തൺ കോഡ് എഴുതുക, പ്രധാന ഫംഗ്ഷനുകൾ നിർവചിക്കുക.
  • വിലയിരുത്തുക: ജനറേറ്റ് ചെയ്ത കോഡ് ഒരു സാൻഡ്‌ബോക്സ് പരിതസ്ഥിതിയിൽ (Sandbox environment) പ്രവർത്തിപ്പിച്ച്, പ്രകടന സൂചകങ്ങളിൽ ഫീഡ്‌ബാക്ക് നൽകുക.

പ്രവർത്തനരീതി

പരിണാമ പ്രക്രിയയിൽ, ALMA ഒരു വലിയ ഡിസൈൻ ട്രീ (Design tree) ഉണ്ടാക്കുന്നു. ആവർത്തനങ്ങളുടെ എണ്ണം കൂടുന്തോറും, ജനറേറ്റ് ചെയ്യുന്ന മെമ്മറി കോഡ് ലളിതമായ സ്റ്റോറേജ് ലോജിക്കിൽ നിന്ന് (Storage logic) സങ്കീർണ്ണമായ കോഗ്നിറ്റീവ് ആർക്കിടെക്ചറായി (Cognitive architecture) മാറുന്നു.

പരിണാമ ട്രീ

വികസിപ്പിച്ചെടുത്ത മെമ്മറി ഘടന

ALMA ഉണ്ടാക്കിയ മെമ്മറി ഡിസൈനുകൾ ഓരോ ടാസ്‌ക്കുകളിലും വലിയ വ്യത്യാസങ്ങൾ കാണിച്ചു:

  • MiniHack (Dungeon Exploration): Risk and Interaction മൊഡ്യൂൾ രൂപകൽപ്പന ചെയ്തു, ഇത് രക്തം നഷ്ടപ്പെടുത്തുന്ന പ്രവർത്തനങ്ങളും രാക്ഷസന്മാരുടെ ആക്രമണോത്സുകതയും വ്യക്തമായി രേഖപ്പെടുത്തുന്നു.
  • Baba Is AI (Logic Puzzle): Strategy Library രൂപകൽപ്പന ചെയ്തു, ലെവലുകൾ കടന്നുപോകാൻ ആവശ്യമായ നിയമങ്ങളുടെ കോമ്പിനേഷനുകൾ രേഖപ്പെടുത്തുന്നു.

മെമ്മറി ഘടന

ഓരോ ടാസ്‌ക്കിന്റെയും പ്രത്യേകതകൾ തിരിച്ചറിയാൻ AI-ക്ക് കഴിയുമെന്നാണ് ഇത് കാണിക്കുന്നത്: അതിജീവന ഗെയിമുകൾ അപകടസാധ്യതകളിൽ ശ്രദ്ധ കേന്ദ്രീകരിക്കണം, പസിൽ ഗെയിമുകൾ നിയമങ്ങളുടെ സംഗ്രഹത്തിൽ ശ്രദ്ധിക്കണം.

പരീക്ഷണ ഫലങ്ങൾ

TextWorld, ALFWorld, MiniHack, Baba Is AI എന്നീ നാല് പരിതസ്ഥിതികളിൽ ALMA-യെ പ്രധാന അടിസ്ഥാനങ്ങളുമായി (Baselines) താരതമ്യം ചെയ്തു.

GPT-5-mini മോഡലിൽ, ALMA-യുടെ ശരാശരി വിജയ നിരക്ക് 53.9% ആണ്, ഇത് G-Memory (46.0%)യെക്കാളും Trajectory Retrieval (48.6%) നെക്കാളും മികച്ചതാണ്.

പരീക്ഷണ ഫലങ്ങൾ

ചെലവ് കുറഞ്ഞ കാര്യത്തിൽ, ALMA ശരാശരി 1,319 ടോക്കണുകൾ (tokens)മാത്രമേ ഉപയോഗിക്കുന്നുള്ളൂ, അതേസമയം Trajectory Retrieval 9,149 ടോക്കണുകളും G-Memory 6,055 ടോക്കണുകളും ഉപയോഗിക്കുന്നു. ഏകദേശം 1/7 മുതൽ 1/5 വരെ കുറഞ്ഞ ചിലവിൽ, ALMA മികച്ച പ്രകടനം കാഴ്ചവയ്ക്കുന്നു.

ചെലവ് കുറഞ്ഞ രീതി

ഉപസംഹാരം

സോഫ്റ്റ്‌വെയർ 2.0 (Neural Networks) ൽ നിന്ന് സോഫ്റ്റ്‌വെയർ 3.0 (AI-Generating Algorithms) ലേക്കുള്ള മാറ്റത്തിന്റെ സാധ്യത ALMA കാണിക്കുന്നു.

ഏജന്റ് വികസനത്തിൽ, മെമ്മറി മൊഡ്യൂളിന്റെ രൂപകൽപ്പന വളരെക്കാലമായി എഞ്ചിനീയർമാരുടെ സഹായത്തെ ആശ്രയിച്ചിരിക്കുന്നു. മെറ്റാ ലേണിംഗിലൂടെയും കോഡ് ജനറേഷനിലൂടെയും, AI-ക്ക് ഓരോ സാഹചര്യങ്ങൾക്കനുരിച്ച് ഏറ്റവും അനുയോജ്യമായ മെമ്മറി ആർക്കിടെക്ചർ സ്വയം കണ്ടെത്താൻ കഴിയുമെന്ന് ALMA തെളിയിക്കുന്നു.

ഉറവിട ലിങ്കുകൾ

Published in Technology

You Might Also Like

📝
Technology

Claude Code Buddy മാറ്റം മാർഗ്ഗനിർദ്ദേശം: എങ്ങനെ മിനുക്കിയ പാരമ്പര്യതലത്തെ പെട്ടി നേടാം

Claude Code Buddy മാറ്റം മാർഗ്ഗനിർദ്ദേശം: എങ്ങനെ മിനുക്കിയ പാരമ്പര്യതലത്തെ പെട്ടി നേടാം 2026年4月1日,Anthropic 在 Claude Cod...

Obsidian Defuddle പുറത്തിറക്കി, Obsidian Web Clipper-നെ പുതിയ ഉയരത്തിലേക്ക് കൊണ്ടുപോയിTechnology

Obsidian Defuddle പുറത്തിറക്കി, Obsidian Web Clipper-നെ പുതിയ ഉയരത്തിലേക്ക് കൊണ്ടുപോയി

Obsidian Defuddle പുറത്തിറക്കി, Obsidian Web Clipper-നെ പുതിയ ഉയരത്തിലേക്ക് കൊണ്ടുപോയി ഞാൻ എപ്പോഴും Obsidian-ന്റെ ആധാരഭ...

OpenAI അപ്രതീക്ഷിതമായി "മൂന്ന്-in-ഒന്ന്" പ്രഖ്യാപിച്ചു: ബ്രൗസർ + പ്രോഗ്രാമിംഗ് + ChatGPT സംയോജനം, കഴിഞ്ഞ ഒരു വർഷം തെറ്റായ വഴിയിലേക്കു പോയതായി ആന്തരികമായി അംഗീകരിച്ചുTechnology

OpenAI അപ്രതീക്ഷിതമായി "മൂന്ന്-in-ഒന്ന്" പ്രഖ്യാപിച്ചു: ബ്രൗസർ + പ്രോഗ്രാമിംഗ് + ChatGPT സംയോജനം, കഴിഞ്ഞ ഒരു വർഷം തെറ്റായ വഴിയിലേക്കു പോയതായി ആന്തരികമായി അംഗീകരിച്ചു

OpenAI അപ്രതീക്ഷിതമായി "മൂന്ന്-in-ഒന്ന്" പ്രഖ്യാപിച്ചു: ബ്രൗസർ + പ്രോഗ്രാമിംഗ് + ChatGPT സംയോജനം, കഴിഞ്ഞ ഒരു വർഷം തെറ്റാ...

2026, ഇനി സ്വയം 'ആത്മനിർവഹണം' ചെയ്യാൻ സമ്മർദം നൽകേണ്ട! ഈ 8 ചെറിയ കാര്യങ്ങൾ ചെയ്യുക, ആരോഗ്യവും സ്വാഭാവികമായി വരുംHealth

2026, ഇനി സ്വയം 'ആത്മനിർവഹണം' ചെയ്യാൻ സമ്മർദം നൽകേണ്ട! ഈ 8 ചെറിയ കാര്യങ്ങൾ ചെയ്യുക, ആരോഗ്യവും സ്വാഭാവികമായി വരും

2026, ഇനി സ്വയം 'ആത്മനിർവഹണം' ചെയ്യാൻ സമ്മർദം നൽകേണ്ട! ഈ 8 ചെറിയ കാര്യങ്ങൾ ചെയ്യുക, ആരോഗ്യവും സ്വാഭാവികമായി വരും പുതിയ ...

അവിടെ കുറവായിട്ടും കുറയാത്ത അമ്മമാർ, അവരെ ഇവിടെ കാണാംHealth

അവിടെ കുറവായിട്ടും കുറയാത്ത അമ്മമാർ, അവരെ ഇവിടെ കാണാം

അവിടെ കുറവായിട്ടും കുറയാത്ത അമ്മമാർ, അവരെ ഇവിടെ കാണാം മാർച്ച് മാസത്തിന്റെ മധ്യത്തിൽ, നിങ്ങളുടെ കുറവാക്കൽ പദ്ധതിയേന്താണ്...

📝
Technology

AI Browser 24 മണിക്കൂർ സ്ഥിരമായ പ്രവർത്തന മാർഗ്ഗനിർദ്ദേശം

AI Browser 24 മണിക്കൂർ സ്ഥിരമായ പ്രവർത്തന മാർഗ്ഗനിർദ്ദേശം ഈ ട്യൂട്ടോറിയൽ ഒരു സ്ഥിരമായ, ദീർഘകാല പ്രവർത്തനമുള്ള AI ബ്രൗസർ ...