அளவுருக்களை மாற்றாமல், குறியீட்டை மட்டும் எழுதுங்கள்! ஜெஃப் க்ளூன் குழுவின் புதிய படைப்பு: மெட்டா ஏஜென்ட் தானாக நினைவக தொகுதியை உருவாக்குகிறது

Software 3.0-க்கு செல்லும் வழியில், AI தனது சொந்த பைதான் குறியீட்டை எழுதி மூளையை மேம்படுத்தத் தொடங்குகிறது.

ALMA

ஏஜென்ட் உருவாக்கத்தின் ஆழமான பகுதியில், நினைவகம் (Memory) எப்போதும் தவிர்க்க முடியாத ஒரு பிரச்சினையாக உள்ளது.

அடிப்படை மாதிரிகளின் திறன் அதிகரித்து வந்தாலும், அவை பகுத்தறிவு செயல்பாட்டில் நிலையற்றவை (Stateless). இது ஏஜென்ட்கள் தொடர்ந்து அனுபவத்தைப் பெறும் திறனைக் கட்டுப்படுத்துகிறது.

தற்போது, RAG அல்லது ஸ்லைடிங் விண்டோ சுருக்கம் போன்ற நினைவகத்தை கையாளும் முக்கிய தொழில்துறை தீர்வுகள், மனிதனால் வடிவமைக்கப்பட்ட ஹியூரிஸ்டிக் விதிகளின் கட்டத்தில் உள்ளன.

கைமுறையாக உருவாக்கப்பட்ட இந்த நினைவக தொகுதிகள் மிகவும் பலவீனமானவை மற்றும் நகர்த்துவது கடினம். உரையாடல் அமைப்புகளுக்காக கவனமாக சரிசெய்யப்பட்ட Prompt மற்றும் மீட்டெடுக்கும் தர்க்கம், நீண்ட தூர திட்டமிடல் பணிகள் (ALFWorld போன்றவை) அல்லது சிக்கலான உத்தி விளையாட்டுகளில் வைக்கப்பட்டால், பெரும்பாலும் தோல்வியடையும்.

ALMA கட்டமைப்பு

இந்த சிக்கலைத் தீர்க்க, UBC பேராசிரியர் மற்றும் OpenAI-யின் முன்னாள் ஆராய்ச்சியாளர் ஜெஃப் க்ளூன் குழு ஒரு கீக் பாணியிலான தீர்வை வழங்கியுள்ளது.

எந்த வகையான நினைவக அமைப்பு சிறந்தது என்று தெரியாததால், ஏஜென்ட்களே பைதான் குறியீட்டை எழுதி வடிவமைக்கட்டும்.

இதுதான் இப்போது வெளியிடப்பட்ட ALMA (Automated meta-Learning of Memory designs for Agentic systems).

ADAS இலிருந்து ALMA வரை: குறியீடு அடிப்படையிலான தானியங்கி வடிவமைப்பு

ALMA என்பது இந்த குழு சமீபத்தில் ஊக்குவித்த AI உருவாக்கும் அல்காரிதம் தொழில்நுட்ப பாதையின் தொடர்ச்சியாகும்.

ADAS

ADAS (Automated Design of Agentic Systems) இல், ஏஜென்ட் கட்டமைப்பை வடிவமைக்கும்போது, நரம்பியல் நெட்வொர்க் வெயிட்டுகள் அல்லது சாஃப்ட் ப்ராம்ப்ட்களை விட குறியீடு மிகவும் திறமையான தேடல் இடம் என்பதை குழு நிரூபித்தது. குறியீடு டூரிங் முழுமையானது மற்றும் வலுவான விளக்கமளிக்கும் திறனைக் கொண்டுள்ளது.

Meta Agent

பின்னர் DGM (Darwin Gödel Machine) இல், குழு பரிணாம அல்காரிதம்களில் இருந்து திறந்தநிலை ஆய்வு கருத்தை அறிமுகப்படுத்தியது. ஒரு வடிவமைப்பு காப்பகத்தை பராமரித்து, புதிய தீர்வுகளை ஆராய மாதிரியை ஊக்குவித்தது.

DGM

ALMA, ADAS-ன் குறியீடு உருவாக்கும் முன்னுதாரணத்தையும், DGM-ன் பரிணாம உத்தியையும் பெற்றுள்ளது. மேலும் ஏஜென்ட் அமைப்புகளில் மனித அனுபவத்தை அதிகம் நம்பியிருக்கும் கூறு - நினைவகத்தில் கவனம் செலுத்துகிறது.

ALMA-வின் வேலை செய்யும் முறை

ALMA-வின் இயக்க முறைமை ஒரு நிலையான மெட்டா கற்றல் சுழற்சியாகும். மெட்டா ஏஜென்ட் நேரடியாக பணியை கையாளுவதில்லை, ஆனால் நிரலாக்கத்திற்கு பொறுப்பாகும். இந்த செயல்பாட்டில் நான்கு நிலைகள் உள்ளன:

கருத்து: தற்போதைய நினைவக வடிவமைப்பு காப்பகத்தை பகுப்பாய்வு செய்து, வரலாற்று செயல்திறனை அடிப்படையாகக் கொண்டு மேம்பாட்டு திட்டங்களை உருவாக்குதல்
திட்டமிடல்: கருத்துக்களை போலி குறியீடு தர்க்கமாக மாற்றுதல்
செயல்படுத்துதல்: இயக்கக்கூடிய பைதான் குறியீட்டை எழுதுதல், முக்கிய செயல்பாடுகளை வரையறுத்தல்
மதிப்பீடு: உருவாக்கப்பட்ட குறியீட்டை சாண்ட்பாக்ஸ் சூழலில் பணியை இயக்க பயன்படுத்தவும், செயல்திறன் குறிகாட்டிகளைப் பெறவும்

வேலை செய்யும் முறை

பரிணாம வளர்ச்சியில், ALMA ஒரு பெரிய வடிவமைப்பு மரத்தை உருவாக்கும். மறு செய்கைகளின் எண்ணிக்கை அதிகரிக்கும்போது, உருவாக்கப்பட்ட நினைவக குறியீடு படிப்படியாக எளிய சேமிப்பக தர்க்கத்திலிருந்து சிக்கலான அறிவாற்றல் கட்டமைப்பாக உருவாகிறது.

பரிணாம மரம்

உருவான நினைவக அமைப்பு

ALMA உருவாக்கிய நினைவக வடிவமைப்புகள் வெவ்வேறு பணிகளில் பெரிய வேறுபாடுகளைக் காட்டுகின்றன:

MiniHack (நிலவறை சாகசம்): Risk and Interaction தொகுதியை வடிவமைத்துள்ளது, இது இரத்த இழப்பை ஏற்படுத்தும் செயல்பாடுகள் மற்றும் அரக்கர்களின் ஆக்கிரமிப்பு ஆகியவற்றைப் பதிவு செய்கிறது.
Baba Is AI (தர்க்க புதிர்): Strategy Library ஐ வடிவமைத்துள்ளது, இது நிலைகளை கடக்க தேவையான விதி சேர்க்கைகளை பதிவு செய்கிறது.

நினைவக அமைப்பு

இது AI பணியின் பண்புகளை அடையாளம் காண முடியும் என்பதைக் காட்டுகிறது: உயிர்வாழும் விளையாட்டுகள் ஆபத்தில் கவனம் செலுத்த வேண்டும், புதிர் விளையாட்டுகள் விதி சுருக்கங்களில் கவனம் செலுத்த வேண்டும்.

சோதனை முடிவுகள்

TextWorld, ALFWorld, MiniHack, Baba Is AI ஆகிய நான்கு சூழல்களில் ALMA முக்கிய அடிப்படை வரிகளுடன் ஒப்பிடப்பட்டது.

GPT-5-mini மாதிரியில், ALMA-வின் சராசரி வெற்றி விகிதம் 53.9% ஐ எட்டியது, இது G-Memory (46.0%) மற்றும் Trajectory Retrieval (48.6%) ஐ விட சிறந்தது.

சோதனை முடிவுகள்

செலவு செயல்திறனைப் பொறுத்தவரை, ALMA சராசரியாக 1,319 டோக்கன்களை மட்டுமே பயன்படுத்துகிறது, அதே நேரத்தில் Trajectory Retrieval 9,149 டோக்கன்களைப் பயன்படுத்துகிறது, மேலும் G-Memory 6,055 டோக்கன்களை எட்டியது. ALMA சுமார் 1/7 முதல் 1/5 செலவில் சிறந்த செயல்திறனைப் பெறுகிறது.

செலவு செயல்திறன்

முடிவுரை

ALMA Software 2.0 (Neural Networks) இலிருந்து Software 3.0 (AI-Generating Algorithms) க்கு மாறுவதற்கான சாத்தியத்தை காட்டுகிறது.

ஏஜென்ட் உருவாக்கத்தில், நினைவக தொகுதியின் வடிவமைப்பு நீண்ட காலமாக பொறியாளர்களின் உள்ளுணர்வை நம்பியுள்ளது. மெட்டா கற்றல் மற்றும் குறியீடு உருவாக்கம் மூலம், AI குறிப்பிட்ட சூழலுக்கு ஏற்ப தானாகவே சிறந்த நினைவக கட்டமைப்பை கண்டறிய முடியும் என்பதை ALMA நிரூபிக்கிறது.

ஆதார இணைப்புகள்

கட்டுரை: https://arxiv.org/pdf/2602.07755
குறியீடு: https://github.com/zksha/alma
திட்ட முகப்பு: https://yimingxiong.me/alma

ADAS இலிருந்து ALMA வரை: குறியீடு அடிப்படையிலான தானியங்கி வடிவமைப்பு

ALMA-வின் வேலை செய்யும் முறை

உருவான நினைவக அமைப்பு

சோதனை முடிவுகள்

முடிவுரை

ஆதார இணைப்புகள்

You Might Also Like

Claude Code Buddy மாற்றம் வழிகாட்டி: எவ்வாறு மின்ன闪传说 நிலை செல்லப்பிராணிகளை பெறுவது

Obsidian வெளியிட்ட Defuddle, Obsidian Web Clipper-ஐ புதிய உயரத்திற்கு கொண்டு சென்றது

2026, உங்களை 'சுய கட்டுப்பாடு' செய்ய அழைக்காதீர்கள்! இந்த 8 சிறிய விஷயங்களைச் செய்யுங்கள், ஆரோக்கியம் தானாகவே வரும்

அந்த முயற்சியுடன் எடை குறைக்க முயற்சிக்கும் அம்மாக்கள், இங்கே தவறுகிறார்கள்

AI Browser 24 மணி நேர நிலையான இயக்கம் வழிகாட்டி