ایک 107 صفحات پر مشتمل RAG اور ایجنٹ اور ایل ایل ایم میموری کا جائزہ
آج میں رینمن یونیورسٹی، فودان یونیورسٹی، پیکنگ یونیورسٹی وغیرہ کی 107 صفحات پر مشتمل تکنیکی جائزہ رپورٹ "AI ایجنٹس کے دور میں میموری: ایک سروے فارمز، فنکشنز اور ڈائنامکس" شیئر کر رہا ہوں۔
پروجیکٹ ایڈریس: https://github.com/Shichun-Liu/Agent-Memory-Paper-List
پیپر ایڈریس: https://arxiv.org/pdf/2512.13564

گزشتہ دو سالوں میں، ہم نے بڑے لسانی ماڈلز (LLM) کے AI ذہین ایجنٹوں (AI Agents) میں حیرت انگیز ارتقاء کا مشاہدہ کیا ہے۔ ڈیپ ریسرچ سے لے کر سافٹ ویئر انجینئرنگ تک، سائنسی دریافت سے لے کر ملٹی ایجنٹ تعاون تک، یہ بنیادی ماڈل پر مبنی ذہین ایجنٹ مصنوعی عمومی ذہانت (AGI) کی حدود کو آگے بڑھا رہے ہیں۔
لیکن ایک بنیادی سوال ابھرتا ہے: جامد LLM پیرامیٹرز کو تیزی سے اپ ڈیٹ نہیں کیا جا سکتا، تو ایجنٹ کو مسلسل سیکھنے اور موافقت کی صلاحیت کیسے حاصل ہو سکتی ہے؟
اس کا جواب ہے - میموری (Memory)۔
"میموری ایک جامد LLM کو ایک ایسے ذہین ایجنٹ میں تبدیل کرنے کی کلیدی صلاحیت ہے جو ماحولیاتی تعامل کے ذریعے مسلسل موافقت پذیر ہو سکے۔"

Figure 1 مقالے کے ذریعہ پیش کردہ یونیفائیڈ درجہ بندی کے فریم ورک کو ظاہر کرتا ہے، جو ایجنٹ میموری کو فارمز (Forms)، فنکشنز (Functions)، ڈائنامکس (Dynamics) تین جہتوں کے مطابق ترتیب دیتا ہے، اور نمائندہ نظاموں کو اس درجہ بندی کے نظام میں نقش کرتا ہے۔

مقالہ ایجنٹ میموری اور کئی قریبی متعلقہ لیکن بنیادی طور پر مختلف تصورات کے درمیان واضح فرق بھی کرتا ہے: LLM میموری، ریٹریول اگمینٹڈ جنریشن (RAG) اور کانٹیکسٹ انجینئرنگ۔ اگرچہ یہ سب معلومات کے ذخیرہ کرنے اور استعمال سے متعلق ہیں، لیکن ان کے مقاصد، میکانزم اور اطلاق کے منظرناموں میں اہم اختلافات موجود ہیں۔
ذہین ایجنٹ میموری ٹیکنالوجی
-
Self-Evolving Memory: Memento, H2R
-
Multimodal Memory: Ella, ViloMem, M3-Agent
-
Latent Memory: MemoryLLM, M+, MemGen
-
Parametric Memory: Retroformer, Early experience
-
RL-enabled Memory: MemAgent, RMM, MemSearcher, MEM1, Mem-alpha, Memory-R1
ذہین ایجنٹ میموری بمقابلہ RAG
RAG سے متعلقہ ٹیکنالوجیز:
-
Modular RAG: FlashRAG, ComposeRAG
-
Graph RAG: LightRAG, HippoRAG
-
Agentic RAG: PlanRAG, Self-RAG
RAG اور ذہین ایجنٹ میموری دونوں میں ماڈل کی صلاحیتوں کو بڑھانے کے لیے بیرونی اسٹوریج سے معلومات بازیافت کرنا شامل ہے، لیکن دونوں کے ڈیزائن فلسفے میں بنیادی فرق موجود ہے:
فیچرRAGذہین ایجنٹ میموری بنیادی مقصدموجودہ سوال کے لیے متعلقہ پس منظر کی معلومات فراہم کرناوقت کے ساتھ ساتھ مسلسل سیکھنے اور موافقت پذیر رویے کی حمایت کرنا معلومات کا ذرعمعمولاً جامد، پہلے سے تعمیر شدہ نالج بیسمتحرک طور پر تیار کردہ، ایجنٹ کے اپنے تعامل کے تجربے سے حاصل کردہ ذاتی معلومات بازیافت کا محرکصارف کے سوال سے غیر فعال طور پر متحرکایجنٹ فعال طور پر فیصلہ کرتا ہے کہ کب، کیا بازیافت کرنا ہے معلومات کی تجدیدنالج بیس عام طور پر آف لائن اپ ڈیٹ ہوتا ہےآن لائن، مسلسل، منتخب طور پر اپ ڈیٹ ہوتا ہے فیڈ بیک لوپکوئی براہ راست فیڈ بیک میکانزم نہیںماحول کے ساتھ تعامل ایک بند لوپ بناتا ہے
اہم فرق: RAG ایک علم کی توسیع کا آلہ ہے، جبکہ ذہین ایجنٹ میموری ایک سیکھنے کا میکانزم ہے۔ RAG جواب دیتا ہے "میں کیا جانتا ہوں"، ذہین ایجنٹ میموری جواب دیتا ہے "میں نے کیا سیکھا"۔
ذہین ایجنٹ میموری بمقابلہ LLM میموری
LLM میموری سے متعلقہ ٹیکنالوجیز:
-
Attention KV management: Mixture-of-Memory
-
Long context processing: Mamba, Memformer, MoA, Sparseformer, NSA
جہتLLM میموریذہین ایجنٹ میموری تعریفماڈل کے پیرامیٹرز میں شامل علم، یا سیاق و سباق کی ونڈو میں عارضی معلوماتایجنٹ کے ماحول کے ساتھ مسلسل تعامل، کراس ٹاسک سیکھنے اور طویل مدتی موافقت کی حمایت کرنے والا بیرونی نظام وقت کا پیمانہپری ٹریننگ ڈیٹا یا موجودہ ڈائیلاگ سیاق و سباق تک محدودمتعدد کاموں، سیشنوں پر محیط، تاحیات سیکھنے کی حمایت کرتا ہے قابل تجدیدیتپیرامیٹر اپ ڈیٹ کی لاگت بہت زیادہ ہے، سیاق و سباق کی معلومات آسانی سے ضائع ہو جاتی ہےموثر، منتخب اور متحرک اپ ڈیٹ اور ارتقاء کی حمایت کرتا ہے فعالیتسوالات کا غیر فعال جوابفعال طور پر فیصلہ کرتا ہے کہ کیا ذخیرہ کرنا ہے، اپ ڈیٹ کرنا ہے، بازیافت کرنا ہے ماحول کے ساتھ جوڑماحول کے ساتھ کوئی براہ راست تعامل نہیںماحولیاتی فیڈ بیک کے ساتھ گہرائی سے مربوط، انٹرایکٹو سیکھنے کی حمایت کرتا ہے
اہم فرق: LLM میموری بنیادی طور پر جامد (پیرامیٹرز فکسڈ) یا عارضی (سیاق و سباق محدود) ہے، جبکہ ذہین ایجنٹ میموری متحرک، مستقل اور ماحولیاتی طور پر جوڑا ہوا ہے۔
ذہین ایجنٹ میموری بمقابلہ کانٹیکسٹ انجینئرنگ
کانٹیکسٹ انجینئرنگ سے متعلقہ ٹیکنالوجیز:
-
Tool-integrated reasoning: ReTool, ToolLLM, Toolformer, VTool-R1, ToRL
-
Tool selection: AutoTool, VisTA
-
Communication protocol: ANP, A2A, MCP, Agora
پہلوکانٹیکسٹ انجینئرنگذہین ایجنٹ میموری توجہ کا مرکزمفرد راؤنڈ یا موجودہ کام کے ان پٹ کو بہتر بنانامعلومات کے مستقل مزاجی اور متعدد راؤنڈز، متعدد کاموں میں استعمال پر وقت کا جہتموجودہ سیشنطویل مدتی تاریخ معلومات کا انتخابانسانی ڈیزائن یا ہیورسٹک اصولخودکار تشکیل، ارتقاء، بازیافت کا میکانزم اسٹیٹس مینجمنٹکوئی مستقل اسٹیٹ نہیںارتقاء پذیر میموری اسٹیٹ کو واضح طور پر برقرار رکھتا ہے
اہم فرق: کانٹیکسٹ انجینئرنگ ایک اشارہ کی اصلاح کی تکنیک ہے، ذہین ایجنٹ میموری ایک اسٹیٹ مینجمنٹ سسٹم ہے۔ سابقہ اس بات پر توجہ مرکوز کرتا ہے کہ "اب کیا ان پٹ کیا جائے"، مؤخر الذکر اس بات پر توجہ مرکوز کرتا ہے کہ "ماضی میں کیا یاد رکھا گیا، یہ اب اور مستقبل کو کیسے متاثر کرتا ہے"۔





