அளவுருக்களை மாற்றாமல், குறியீட்டை மட்டும் எழுதுங்கள்! ஜெஃப் க்ளூன் குழுவின் புதிய படைப்பு: மெட்டா ஏஜென்ட் தானாக நினைவக தொகுதியை உருவாக்குகிறது
அளவுருக்களை மாற்றாமல், குறியீட்டை மட்டும் எழுதுங்கள்! ஜெஃப் க்ளூன் குழுவின் புதிய படைப்பு: மெட்டா ஏஜென்ட் தானாக நினைவக தொகுதியை உருவாக்குகிறது
Software 3.0-க்கு செல்லும் வழியில், AI தனது சொந்த பைதான் குறியீட்டை எழுதி மூளையை மேம்படுத்தத் தொடங்குகிறது.

ஏஜென்ட் உருவாக்கத்தின் ஆழமான பகுதியில், நினைவகம் (Memory) எப்போதும் தவிர்க்க முடியாத ஒரு பிரச்சினையாக உள்ளது.
அடிப்படை மாதிரிகளின் திறன் அதிகரித்து வந்தாலும், அவை பகுத்தறிவு செயல்பாட்டில் நிலையற்றவை (Stateless). இது ஏஜென்ட்கள் தொடர்ந்து அனுபவத்தைப் பெறும் திறனைக் கட்டுப்படுத்துகிறது.
தற்போது, RAG அல்லது ஸ்லைடிங் விண்டோ சுருக்கம் போன்ற நினைவகத்தை கையாளும் முக்கிய தொழில்துறை தீர்வுகள், மனிதனால் வடிவமைக்கப்பட்ட ஹியூரிஸ்டிக் விதிகளின் கட்டத்தில் உள்ளன.
கைமுறையாக உருவாக்கப்பட்ட இந்த நினைவக தொகுதிகள் மிகவும் பலவீனமானவை மற்றும் நகர்த்துவது கடினம். உரையாடல் அமைப்புகளுக்காக கவனமாக சரிசெய்யப்பட்ட Prompt மற்றும் மீட்டெடுக்கும் தர்க்கம், நீண்ட தூர திட்டமிடல் பணிகள் (ALFWorld போன்றவை) அல்லது சிக்கலான உத்தி விளையாட்டுகளில் வைக்கப்பட்டால், பெரும்பாலும் தோல்வியடையும்.

இந்த சிக்கலைத் தீர்க்க, UBC பேராசிரியர் மற்றும் OpenAI-யின் முன்னாள் ஆராய்ச்சியாளர் ஜெஃப் க்ளூன் குழு ஒரு கீக் பாணியிலான தீர்வை வழங்கியுள்ளது.
எந்த வகையான நினைவக அமைப்பு சிறந்தது என்று தெரியாததால், ஏஜென்ட்களே பைதான் குறியீட்டை எழுதி வடிவமைக்கட்டும்.
இதுதான் இப்போது வெளியிடப்பட்ட ALMA (Automated meta-Learning of Memory designs for Agentic systems).
ADAS இலிருந்து ALMA வரை: குறியீடு அடிப்படையிலான தானியங்கி வடிவமைப்பு
ALMA என்பது இந்த குழு சமீபத்தில் ஊக்குவித்த AI உருவாக்கும் அல்காரிதம் தொழில்நுட்ப பாதையின் தொடர்ச்சியாகும்.

ADAS (Automated Design of Agentic Systems) இல், ஏஜென்ட் கட்டமைப்பை வடிவமைக்கும்போது, நரம்பியல் நெட்வொர்க் வெயிட்டுகள் அல்லது சாஃப்ட் ப்ராம்ப்ட்களை விட குறியீடு மிகவும் திறமையான தேடல் இடம் என்பதை குழு நிரூபித்தது. குறியீடு டூரிங் முழுமையானது மற்றும் வலுவான விளக்கமளிக்கும் திறனைக் கொண்டுள்ளது.

பின்னர் DGM (Darwin Gödel Machine) இல், குழு பரிணாம அல்காரிதம்களில் இருந்து திறந்தநிலை ஆய்வு கருத்தை அறிமுகப்படுத்தியது. ஒரு வடிவமைப்பு காப்பகத்தை பராமரித்து, புதிய தீர்வுகளை ஆராய மாதிரியை ஊக்குவித்தது.

ALMA, ADAS-ன் குறியீடு உருவாக்கும் முன்னுதாரணத்தையும், DGM-ன் பரிணாம உத்தியையும் பெற்றுள்ளது. மேலும் ஏஜென்ட் அமைப்புகளில் மனித அனுபவத்தை அதிகம் நம்பியிருக்கும் கூறு - நினைவகத்தில் கவனம் செலுத்துகிறது.
ALMA-வின் வேலை செய்யும் முறை
ALMA-வின் இயக்க முறைமை ஒரு நிலையான மெட்டா கற்றல் சுழற்சியாகும். மெட்டா ஏஜென்ட் நேரடியாக பணியை கையாளுவதில்லை, ஆனால் நிரலாக்கத்திற்கு பொறுப்பாகும். இந்த செயல்பாட்டில் நான்கு நிலைகள் உள்ளன:
- கருத்து: தற்போதைய நினைவக வடிவமைப்பு காப்பகத்தை பகுப்பாய்வு செய்து, வரலாற்று செயல்திறனை அடிப்படையாகக் கொண்டு மேம்பாட்டு திட்டங்களை உருவாக்குதல்
- திட்டமிடல்: கருத்துக்களை போலி குறியீடு தர்க்கமாக மாற்றுதல்
- செயல்படுத்துதல்: இயக்கக்கூடிய பைதான் குறியீட்டை எழுதுதல், முக்கிய செயல்பாடுகளை வரையறுத்தல்
- மதிப்பீடு: உருவாக்கப்பட்ட குறியீட்டை சாண்ட்பாக்ஸ் சூழலில் பணியை இயக்க பயன்படுத்தவும், செயல்திறன் குறிகாட்டிகளைப் பெறவும்

பரிணாம வளர்ச்சியில், ALMA ஒரு பெரிய வடிவமைப்பு மரத்தை உருவாக்கும். மறு செய்கைகளின் எண்ணிக்கை அதிகரிக்கும்போது, உருவாக்கப்பட்ட நினைவக குறியீடு படிப்படியாக எளிய சேமிப்பக தர்க்கத்திலிருந்து சிக்கலான அறிவாற்றல் கட்டமைப்பாக உருவாகிறது.

உருவான நினைவக அமைப்பு
ALMA உருவாக்கிய நினைவக வடிவமைப்புகள் வெவ்வேறு பணிகளில் பெரிய வேறுபாடுகளைக் காட்டுகின்றன:
- MiniHack (நிலவறை சாகசம்): Risk and Interaction தொகுதியை வடிவமைத்துள்ளது, இது இரத்த இழப்பை ஏற்படுத்தும் செயல்பாடுகள் மற்றும் அரக்கர்களின் ஆக்கிரமிப்பு ஆகியவற்றைப் பதிவு செய்கிறது.
- Baba Is AI (தர்க்க புதிர்): Strategy Library ஐ வடிவமைத்துள்ளது, இது நிலைகளை கடக்க தேவையான விதி சேர்க்கைகளை பதிவு செய்கிறது.

இது AI பணியின் பண்புகளை அடையாளம் காண முடியும் என்பதைக் காட்டுகிறது: உயிர்வாழும் விளையாட்டுகள் ஆபத்தில் கவனம் செலுத்த வேண்டும், புதிர் விளையாட்டுகள் விதி சுருக்கங்களில் கவனம் செலுத்த வேண்டும்.
சோதனை முடிவுகள்
TextWorld, ALFWorld, MiniHack, Baba Is AI ஆகிய நான்கு சூழல்களில் ALMA முக்கிய அடிப்படை வரிகளுடன் ஒப்பிடப்பட்டது.
GPT-5-mini மாதிரியில், ALMA-வின் சராசரி வெற்றி விகிதம் 53.9% ஐ எட்டியது, இது G-Memory (46.0%) மற்றும் Trajectory Retrieval (48.6%) ஐ விட சிறந்தது.

செலவு செயல்திறனைப் பொறுத்தவரை, ALMA சராசரியாக 1,319 டோக்கன்களை மட்டுமே பயன்படுத்துகிறது, அதே நேரத்தில் Trajectory Retrieval 9,149 டோக்கன்களைப் பயன்படுத்துகிறது, மேலும் G-Memory 6,055 டோக்கன்களை எட்டியது. ALMA சுமார் 1/7 முதல் 1/5 செலவில் சிறந்த செயல்திறனைப் பெறுகிறது.

முடிவுரை
ALMA Software 2.0 (Neural Networks) இலிருந்து Software 3.0 (AI-Generating Algorithms) க்கு மாறுவதற்கான சாத்தியத்தை காட்டுகிறது.
ஏஜென்ட் உருவாக்கத்தில், நினைவக தொகுதியின் வடிவமைப்பு நீண்ட காலமாக பொறியாளர்களின் உள்ளுணர்வை நம்பியுள்ளது. மெட்டா கற்றல் மற்றும் குறியீடு உருவாக்கம் மூலம், AI குறிப்பிட்ட சூழலுக்கு ஏற்ப தானாகவே சிறந்த நினைவக கட்டமைப்பை கண்டறிய முடியும் என்பதை ALMA நிரூபிக்கிறது.
ஆதார இணைப்புகள்
- கட்டுரை: https://arxiv.org/pdf/2602.07755
- குறியீடு: https://github.com/zksha/alma
- திட்ட முகப்பு: https://yimingxiong.me/alma





