పారామీటర్లను సర్దుబాటు చేయకుండా, కోడ్ను మాత్రమే వ్రాయండి! జెఫ్ క్లూన్ బృందం యొక్క కొత్త పని: మెటా ఏజెంట్ స్వయంచాలకంగా మెమరీ మాడ్యూల్ను అభివృద్ధి చేస్తుంది
పారామీటర్లను సర్దుబాటు చేయకుండా, కోడ్ను మాత్రమే వ్రాయండి! జెఫ్ క్లూన్ బృందం యొక్క కొత్త పని: మెటా ఏజెంట్ స్వయంచాలకంగా మెమరీ మాడ్యూల్ను అభివృద్ధి చేస్తుంది
సాఫ్ట్వేర్ 3.0కి మార్గం, AI తన మెదడును అభివృద్ధి చేయడానికి పైథాన్ కోడ్ను వ్రాయడం ప్రారంభించింది.

ఏజెంట్ అభివృద్ధి యొక్క లోతైన నీటిలో, మెమరీ (Memory) ఎల్లప్పుడూ తప్పించుకోలేని బాధాకరమైన అంశం.
ప్రాథమిక నమూనా యొక్క సామర్థ్యం పెరుగుతున్నప్పటికీ, ఇది తార్కిక ప్రక్రియలో తప్పనిసరిగా స్టేట్లెస్ (Stateless), ఇది ఏజెంట్ అనుభవాన్ని నిరంతరం సేకరించే సామర్థ్యాన్ని పరిమితం చేస్తుంది.
ప్రస్తుతం పరిశ్రమలో మెమరీని నిర్వహించడానికి ప్రధాన స్రవంతి పరిష్కారం RAG లేదా స్లైడింగ్ విండో సారాంశం అయినా, సారాంశంలో ఇది ఇప్పటికీ మానవీయంగా రూపొందించిన హ్యూరిస్టిక్ నియమాల దశలోనే ఉంది.
మానవీయంగా తయారు చేయబడిన ఈ మెమరీ మాడ్యూల్ చాలా పెళుసుగా ఉంటుంది మరియు తరలించడం కష్టం, సంభాషణ వ్యవస్థ కోసం ఖచ్చితంగా ట్యూన్ చేయబడిన ప్రాంప్ట్ మరియు తిరిగి పొందే లాజిక్, ఒకసారి సుదూర ప్రణాళిక పనులలో (ALFWorld వంటివి) లేదా సంక్లిష్ట వ్యూహాత్మక ఆటలలో ఉంచితే, తరచుగా నేరుగా విఫలమవుతుంది.

ఈ ఇబ్బందిని దృష్టిలో ఉంచుకుని, UBC ప్రొఫెసర్ మరియు OpenAI మాజీ పరిశోధకుడు జెఫ్ క్లూన్ బృందం ఒక గీక్-శైలి పరిష్కారాన్ని అందించారు.
ఏ విధమైన మెమరీ నిర్మాణం ఉత్తమమో తెలియకపోతే, ఏజెంట్ స్వయంగా పైథాన్ కోడ్ను వ్రాసి రూపొందించనివ్వండి.
ఇప్పుడే విడుదలైన ALMA (Automated meta-Learning of Memory designs for Agentic systems) ఇదే.
ADAS నుండి ALMA వరకు: కోడ్ ఆధారిత ఆటోమేటెడ్ డిజైన్
ALMA అనేది ఈ బృందం ఇటీవల ప్రోత్సహించిన AI ఉత్పత్తి అల్గారిథమ్ టెక్నికల్ రూట్ యొక్క కొనసాగింపు.

ADAS (Automated Design of Agentic Systems)లో, ఏజెంట్ ఆర్కిటెక్చర్ను రూపొందించేటప్పుడు, కోడ్ న్యూరల్ నెట్వర్క్ వెయిట్స్ లేదా సాఫ్ట్ ప్రాంప్ట్ల కంటే మరింత సమర్థవంతమైన శోధన స్థలమని బృందం నిరూపించింది. కోడ్ ట్యూరింగ్ పూర్తి సామర్థ్యాన్ని కలిగి ఉంది మరియు చాలా వివరణాత్మకమైనది.

తరువాత DGM (Darwin Gödel Machine)లో, బృందం ఎవల్యూషనరీ అల్గారిథమ్లో ఓపెన్-ఎండ్ ఎక్స్ప్లోరేషన్ కాన్సెప్ట్ను ప్రవేశపెట్టింది, ఒక డిజైన్ ఆర్కైవ్ను నిర్వహిస్తుంది మరియు నవల పరిష్కారాలను అన్వేషించడానికి మోడల్ను ప్రోత్సహిస్తుంది.

ALMA ADAS యొక్క కోడ్ జనరేషన్ పారాడిగ్మ్ మరియు DGM యొక్క ఎవల్యూషనరీ స్ట్రాటజీని వారసత్వంగా పొందింది, ఏజెంట్ సిస్టమ్లలో మానవ అనుభవంపై ఎక్కువగా ఆధారపడే భాగం - మెమరీపై దృష్టి పెడుతుంది.
ALMA యొక్క పని విధానం
ALMA యొక్క ఆపరేటింగ్ మెకానిజం ఒక ప్రామాణిక మెటా-లెర్నింగ్ క్లోజ్డ్ లూప్. మెటా ఏజెంట్ ఇకపై నేరుగా పనిని నిర్వహించదు, కానీ ప్రోగ్రామింగ్కు బాధ్యత వహిస్తుంది. ప్రక్రియలో నాలుగు దశలు ఉన్నాయి:
- భావన: ప్రస్తుత మెమరీ డిజైన్ ఆర్కైవ్ను విశ్లేషించండి మరియు చారిత్రక పనితీరు ఆధారంగా మెరుగుదల ప్రణాళికలను రూపొందించండి
- ప్రణాళిక: ఆలోచనలను సూడోకోడ్ లాజిక్గా మార్చండి
- అమలు: అమలు చేయగల పైథాన్ కోడ్ను వ్రాయండి మరియు ప్రధాన విధులను నిర్వచించండి
- మూల్యాంకనం: ఉత్పత్తి చేయబడిన కోడ్ను శాండ్బాక్స్ వాతావరణంలో అమలు చేయడానికి మరియు పనితీరు సూచికలను తిరిగి ఇవ్వడానికి అమలు చేయండి

పరిణామ క్రమంలో, ALMA ఒక పెద్ద డిజైన్ ట్రీని ఉత్పత్తి చేస్తుంది. పునరావృత దశల పెరుగుదలతో, ఉత్పత్తి చేయబడిన మెమరీ కోడ్ సాధారణ నిల్వ లాజిక్ నుండి సంక్లిష్టమైన అభిజ్ఞా నిర్మాణంగా క్రమంగా అభివృద్ధి చెందుతుంది.

అభివృద్ధి చెందిన మెమరీ నిర్మాణం
ALMA ఉత్పత్తి చేసిన మెమరీ డిజైన్ వివిధ పనులలో గొప్ప వ్యత్యాసాన్ని చూపించింది:
- MiniHack (నేలమాళిగ అన్వేషణ): రిస్క్ అండ్ ఇంటరాక్షన్ మాడ్యూల్ను రూపొందించింది, ఇది రక్త నష్టానికి దారితీసే కార్యకలాపాలను మరియు రాక్షసుల దూకుడును స్పష్టంగా నమోదు చేస్తుంది
- Baba Is AI (లాజిక్ పజిల్): స్ట్రాటజీ లైబ్రరీని రూపొందించింది, స్థాయిలను దాటడానికి అవసరమైన నియమాల కలయికను నమోదు చేస్తుంది

ఇది AI టాస్క్ లక్షణాలను గుర్తించగలదని సూచిస్తుంది: మనుగడ ఆటలు ప్రమాదంపై దృష్టి పెట్టాలి మరియు పజిల్ ఆటలు నియమాల సంగ్రహణపై దృష్టి పెట్టాలి.
ప్రయోగ ఫలితాలు
TextWorld, ALFWorld, MiniHack, Baba Is AI అనే నాలుగు పరిసరాలలో ALMAను ప్రధాన స్రవంతి బేస్లైన్లతో పోల్చారు.
GPT-5-mini మోడల్లో, ALMA యొక్క సగటు విజయ రేటు **53.9%**కి చేరుకుంది, ఇది G-Memory (46.0%) మరియు Trajectory Retrieval (48.6%) కంటే మెరుగ్గా ఉంది.

ఖర్చు సామర్థ్యం పరంగా, ALMA సగటున 1,319 టోకెన్లను మాత్రమే వినియోగిస్తుంది, అయితే Trajectory Retrieval 9,149 టోకెన్లను వినియోగిస్తుంది మరియు G-Memory కూడా 6,055 టోకెన్లకు చేరుకుంది. ALMA మెరుగైన పనితీరు కోసం కేవలం 1/7 నుండి 1/5 ఖర్చుతో ట్రేడ్ చేసింది.

ముగింపు
ALMA సాఫ్ట్వేర్ 2.0 (న్యూరల్ నెట్వర్క్స్) నుండి సాఫ్ట్వేర్ 3.0 (AI-ఉత్పత్తి అల్గారిథమ్లు)కి పరివర్తన చెందే అవకాశాన్ని ప్రదర్శిస్తుంది.
ఏజెంట్ అభివృద్ధిలో, మెమరీ మాడ్యూల్ యొక్క రూపకల్పన చాలా కాలంగా ఇంజనీర్ల అంతర్ దృష్టిపై ఆధారపడి ఉంది. మెటా-లెర్నింగ్ మరియు కోడ్ జనరేషన్ ద్వారా, AI నిర్దిష్ట వాతావరణం ప్రకారం ఉత్తమ మెమరీ నిర్మాణాన్ని స్వయంచాలకంగా కనుగొనగలదని ALMA నిరూపించింది.
వనరుల లింక్లు
- పేపర్: https://arxiv.org/pdf/2602.07755
- కోడ్: https://github.com/zksha/alma
- ప్రాజెక్ట్ హోమ్ పేజీ: https://yimingxiong.me/alma





