اليوم، أشارككم مراجعة فنية شاملة من 107 صفحات من جامعة رينمين وجامعة فودان وجامعة بكين بعنوان "الذاكرة في عصر وكلاء الذكاء الاصطناعي: دراسة استقصائية للأشكال والوظائف والديناميكيات".
عنوان المشروع: [https://github.com/Shichun-Liu/Agent-Memory-Paper-List](https://github.com/Shichun-Liu/Agent-Memory-Paper-List)
عنوان الورقة البحثية: [https://arxiv.org/pdf/2512.13564](https://arxiv.org/pdf/2512.13564)

في العامين الماضيين، شهدنا التطور المذهل للنماذج اللغوية الكبيرة (LLM) إلى وكلاء الذكاء الاصطناعي (AI Agents). من البحث العميق إلى هندسة البرمجيات، ومن الاكتشاف العلمي إلى التعاون بين الوكلاء المتعددين، تعمل هذه الوكلاء القائمة على النماذج الأساسية على دفع حدود الذكاء الاصطناعي العام (AGI).
ولكن تظهر مشكلة أساسية: **كيف يمكن للوكلاء أن يتمتعوا بقدرات التعلم المستمر والتكيف في ظل عدم القدرة على تحديث معلمات LLM الثابتة بسرعة؟**
الإجابة هي - **الذاكرة (Memory)**.
> "الذاكرة هي القدرة الرئيسية لتحويل LLM الثابت إلى وكيل ذكي قادر على التكيف باستمرار من خلال التفاعل مع البيئة."

**الشكل 1** يوضح إطار التصنيف الموحد الذي اقترحته الورقة البحثية، والذي ينظم ذاكرة الوكيل وفقًا لثلاثة أبعاد: **الأشكال (Forms)** و **الوظائف (Functions)** و **الديناميكيات (Dynamics)**، ويرسم خرائط للأنظمة التمثيلية في نظام التصنيف هذا.

تميز الورقة البحثية أيضًا بوضوح بين ذاكرة الوكيل وعدد قليل من المفاهيم المرتبطة ارتباطًا وثيقًا ولكنها مختلفة جوهريًا: **ذاكرة LLM** و **الجيل المعزز بالاسترجاع (RAG)** و **هندسة السياق**. على الرغم من أنها كلها مرتبطة بتخزين المعلومات واستخدامها، إلا أن هناك اختلافات رئيسية في الأهداف والآليات وسيناريوهات التطبيق.
## تقنيات ذاكرة الوكيل
- **Self-Evolving Memory**: Memento, H2R
- **Multimodal Memory**: Ella, ViloMem, M3-Agent
- **Latent Memory**: MemoryLLM, M+, MemGen
- **Parametric Memory**: Retroformer, Early experience
- **RL-enabled Memory**: MemAgent, RMM, MemSearcher, MEM1, Mem-alpha, Memory-R1
## ذاكرة الوكيل مقابل RAG
التقنيات المتعلقة بـ RAG:
- **Modular RAG**: FlashRAG, ComposeRAG
- **Graph RAG**: LightRAG, HippoRAG
- **Agentic RAG**: PlanRAG, Self-RAG
يتضمن كل من RAG وذاكرة الوكيل استرجاع المعلومات من التخزين الخارجي لتعزيز قدرات النموذج، ولكن هناك اختلاف جوهري في فلسفة التصميم بين الاثنين:
| الميزة | RAG | ذاكرة الوكيل |
|---|
| الهدف الأساسي | توفير دعم معرفي ذي صلة للاستعلام الحالي | التعلم المستمر والسلوك التكيفي عبر الزمن |
| مصدر المعلومات | عادةً ما تكون قاعدة معرفية ثابتة ومبنية مسبقًا | معلومات شخصية تم إنشاؤها ديناميكيًا من تجارب تفاعل الوكيل نفسه |
| تشغيل الاسترجاع | يتم تشغيله بشكل سلبي بواسطة استعلام المستخدم | يقرر الوكيل بنشاط متى وماذا يسترجع |
| تحديث المعلومات | عادةً ما يتم تحديث قاعدة المعرفة في وضع عدم الاتصال | يتم تحديثه عبر الإنترنت وباستمرار وبشكل انتقائي |
| حلقة التغذية الراجعة | لا توجد آلية تغذية راجعة مباشرة | يشكل حلقة مغلقة مع التفاعل البيئي |
**الاختلاف الرئيسي**: RAG هو **أداة لتوسيع المعرفة**، بينما ذاكرة الوكيل هي **آلية تعلم**. يجيب RAG على "ماذا أعرف"، بينما تجيب ذاكرة الوكيل على "ماذا تعلمت".
## ذاكرة الوكيل مقابل ذاكرة LLM
التقنيات المتعلقة بذاكرة LLM:
- **Attention KV management**: Mixture-of-Memory
- **Long context processing**: Mamba, Memformer, MoA, Sparseformer, NSA
| البعد | ذاكرة LLM | ذاكرة الوكيل |
|---|
| التعريف | المعرفة الداخلية في معلمات النموذج، أو المعلومات المؤقتة في نافذة السياق | نظام خارجي يدعم تفاعل الوكيل المستمر مع البيئة والتعلم عبر المهام والتكيف على المدى الطويل |
| النطاق الزمني | يقتصر على بيانات التدريب المسبق أو سياق المحادثة الحالي | يمتد عبر مهام ومحادثات متعددة، ويدعم التعلم مدى الحياة |
| إمكانية التحديث | تحديث المعلمات مكلف، والمعلومات السياقية متطايرة | يدعم التحديث والتطور الديناميكي الفعال والانتقائي |
| المبادرة | يستجيب بشكل سلبي للاستعلامات | يقرر بنشاط تخزين وتحديث واسترجاع المعلومات |
| الاقتران بالبيئة | لا يوجد تفاعل مباشر مع البيئة | يتكامل بعمق مع ردود الفعل البيئية، ويدعم التعلم التفاعلي |
**الاختلاف الرئيسي**: ذاكرة LLM هي في الأساس **ثابتة** (معلمات ثابتة) أو **عابرة** (سياق محدود)، بينما ذاكرة الوكيل **ديناميكية ومستمرة ومقترنة بالبيئة**.
## ذاكرة الوكيل مقابل هندسة السياق
التقنيات المتعلقة بهندسة السياق:
- **Tool-integrated reasoning**: ReTool, ToolLLM, Toolformer, VTool-R1, ToRL
- **Tool selection**: AutoTool, VisTA
- **Communication protocol**: ANP, A2A, MCP, Agora
| الجانب | هندسة السياق | ذاكرة الوكيل |
|---|
| التركيز | تحسين الإدخال لجولة واحدة أو المهمة الحالية | إضفاء الطابع الدائم على المعلومات واستخدامها عبر جولات ومهام متعددة |
| البعد الزمني | المحادثة الحالية | تاريخ طويل الأجل |
| اختيار المعلومات | قواعد مصممة يدويًا أو إرشادية | آلية آلية للتكوين والتطور والاسترجاع |
| إدارة الحالة | لا توجد حالة مستمرة | صيانة صريحة لحالة ذاكرة قابلة للتطور |
**الاختلاف الرئيسي**: هندسة السياق هي **تقنية لتحسين المطالبات**، بينما ذاكرة الوكيل هي **نظام لإدارة الحالة**. يركز الأول على "ماذا يتم إدخاله الآن"، بينما يركز الأخير على "ماذا تم تذكره في الماضي، وكيف يؤثر على الحاضر والمستقبل".