بغیر پیرامیٹر ٹیوننگ کے، صرف کوڈ لکھیں! جیف کلون کی ٹیم کا نیا کام: میٹا ایجنٹ خودکار طور پر میموری ماڈیول کو تیار کرتا ہے
بغیر پیرامیٹر ٹیوننگ کے، صرف کوڈ لکھیں! جیف کلون کی ٹیم کا نیا کام: میٹا ایجنٹ خودکار طور پر میموری ماڈیول کو تیار کرتا ہے
Software 3.0 کی طرف، AI نے خود Python کوڈ لکھنا شروع کر دیا ہے تاکہ دماغ کو تیار کیا جا سکے۔

ایجنٹ کی ترقی کے گہرے پانیوں میں، یادداشت (Memory) ہمیشہ ایک ایسا تکلیف دہ مسئلہ رہا ہے جس سے بچا نہیں جا سکتا۔
اگرچہ بنیادی ماڈلز کی صلاحیتیں روز بروز مضبوط ہوتی جا رہی ہیں، لیکن استدلال کے عمل میں یہ بنیادی طور پر بے حالت (Stateless) ہوتے ہیں، جو ایجنٹ کی مسلسل تجربہ حاصل کرنے کی صلاحیت کو محدود کرتے ہیں۔
صنعت میں یادداشت سے نمٹنے کے لیے موجودہ اہم حل، چاہے وہ RAG ہو یا سلائیڈنگ ونڈو سمری، بنیادی طور پر اب بھی دستی طور پر ڈیزائن کردہ ہیورسٹک اصولوں کے مرحلے پر ہیں۔
یہ دستی طور پر تیار کردہ میموری ماڈیول انتہائی نازک اور منتقل کرنے میں مشکل ہے، ڈائیلاگ سسٹم کے لیے احتیاط سے ٹیون کردہ Prompt اور بازیافت منطق، ایک بار جب طویل المدتی منصوبہ بندی کے کاموں (جیسے ALFWorld) یا پیچیدہ حکمت عملی گیمز میں ڈال دیا جائے تو اکثر براہ راست ناکام ہو جاتے ہیں۔

اس مشکل کے پیش نظر، UBC کے پروفیسر اور OpenAI کے سابق محقق جیف کلون کی ٹیم نے ایک انتہائی تکنیکی حل پیش کیا ہے۔
چونکہ یہ معلوم نہیں کہ کس قسم کی میموری کی ساخت بہترین ہے، اس لیے ایجنٹ کو خود Python کوڈ لکھنے دیں تاکہ اسے ڈیزائن کیا جا سکے۔
یہ ہے جو ابھی جاری کیا گیا ہے ALMA (Automated meta-Learning of Memory designs for Agentic systems)۔
ADAS سے ALMA تک: کوڈ پر مبنی خودکار ڈیزائن
ALMA اس ٹیم کی جانب سے حال ہی میں فروغ دی جانے والی AI جنریٹو الگورتھم ٹیکنالوجی روڈ میپ کا تسلسل ہے۔

ADAS (Automated Design of Agentic Systems) میں، ٹیم نے ثابت کیا کہ ایجنٹ آرکیٹیکچر کو ڈیزائن کرتے وقت، کوڈ نیورل نیٹ ورک وزن یا Soft Prompts سے زیادہ موثر سرچ اسپیس ہے۔ کوڈ ٹورنگ مکمل ہے، اور اس میں انتہائی مضبوط تشریحیت ہے۔

اس کے بعد DGM (Darwin Gödel Machine) میں، ٹیم نے ارتقائی الگورتھم میں اوپن اینڈڈ ایکسپلوریشن کا تصور متعارف کرایا، ایک ڈیزائن آرکائیو کو برقرار رکھا، اور ماڈل کو نئے حل تلاش کرنے کی ترغیب دی۔

ALMA نے ADAS کے کوڈ جنریشن پیراڈائم اور DGM کی ارتقائی حکمت عملی کو وراثت میں حاصل کیا، اور درخواست کے منظر نامے کو ایجنٹ سسٹم کے سب سے زیادہ انسانی تجربے پر منحصر اجزاء—میموری پر مرکوز کیا۔
ALMA کا ورکنگ میکانزم
ALMA کا آپریٹنگ میکانزم ایک معیاری میٹا لرننگ کلوزڈ لوپ ہے۔ Meta Agent اب براہ راست کاموں کو نہیں سنبھالتا، بلکہ پروگرامنگ کا ذمہ دار ہے۔ عمل میں چار مراحل شامل ہیں:
- تصور (Conceptualization): موجودہ میموری ڈیزائن آرکائیو کا تجزیہ کریں، تاریخی کارکردگی کی بنیاد پر بہتری کے منصوبوں کا تصور کریں
- منصوبہ بندی (Planning): تصور کو سیوڈو کوڈ منطق میں تبدیل کریں
- نفاذ (Implementation): قابل عمل Python کوڈ لکھیں، بنیادی فنکشن کی وضاحت کریں
- تشخیص (Evaluation): تیار کردہ کوڈ کو سینڈ باکس ماحول میں تعینات کریں تاکہ کام انجام دیا جا سکے، کارکردگی کے اشارے کو فیڈ بیک کریں

ارتقائی عمل میں، ALMA ایک بہت بڑا ڈیزائن ٹری تیار کرے گا۔ تکرار کے مراحل میں اضافے کے ساتھ، تیار کردہ میموری کوڈ آہستہ آہستہ سادہ اسٹوریج منطق سے پیچیدہ علمی فن تعمیر میں تیار ہوتا ہے۔

تیار کردہ میموری کی ساخت
ALMA کے تیار کردہ میموری ڈیزائن نے مختلف کاموں میں بہت زیادہ فرق ظاہر کیا ہے:
- MiniHack (ڈنجن ایڈونچر): ایک Risk and Interaction ماڈیول ڈیزائن کیا، جو خون بہنے والے آپریشنز اور راکشسوں کی جارحیت کو واضح طور پر ریکارڈ کرتا ہے۔
- Baba Is AI (منطقی پہیلی): ایک Strategy Library ڈیزائن کیا، جو لیولز کو پاس کرنے کے لیے درکار اصولوں کے مجموعے کو ریکارڈ کرتا ہے۔

یہ ظاہر کرتا ہے کہ AI کام کی خصوصیات کو پہچاننے کے قابل ہے: بقا کے کھیلوں کو خطرے پر توجہ دینے کی ضرورت ہے، اور پہیلی کھیلوں کو اصولوں کے خلاصے پر توجہ دینے کی ضرورت ہے۔
تجرباتی نتائج
TextWorld, ALFWorld, MiniHack, Baba Is AI چار ماحول میں ALMA کا موازنہ اہم بیس لائنز سے کیا گیا۔
GPT-5-mini ماڈل پر، ALMA کی اوسط کامیابی کی شرح 53.9% تک پہنچ گئی، جو G-Memory (46.0%) اور Trajectory Retrieval (48.6%) سے بہتر ہے۔

لاگت کی کارکردگی کے لحاظ سے، ALMA اوسطاً صرف 1,319 tokens استعمال کرتا ہے، جبکہ Trajectory Retrieval 9,149 tokens تک استعمال کرتا ہے، اور G-Memory بھی 6,055 tokens تک پہنچ جاتا ہے۔ ALMA نے صرف تقریباً 1/7 سے 1/5 کے اخراجات کے ساتھ بہتر کارکردگی حاصل کی۔

اختتامیہ
ALMA نے Software 2.0 (Neural Networks) سے Software 3.0 (AI-Generating Algorithms) میں منتقلی کا ایک امکان دکھایا ہے۔
ایجنٹ کی ترقی میں، میموری ماڈیول کا ڈیزائن طویل عرصے سے انجینئرز کی بصیرت پر منحصر ہے۔ ALMA نے ثابت کیا کہ میٹا لرننگ اور کوڈ جنریشن کے ذریعے، AI مخصوص ماحول کے مطابق خود بخود بہترین میموری آرکیٹیکچر تلاش کرنے کے قابل ہے۔
وسائل کے لنکس
- مقالہ: https://arxiv.org/pdf/2602.07755
- کوڈ: https://github.com/zksha/alma
- پروجیکٹ ہوم پیج: https://yimingxiong.me/alma





