एक 107 पेज RAG और एजेंट और LLM मेमोरी की समीक्षा

आज मैं रेन्मिन विश्वविद्यालय, फुडान विश्वविद्यालय, पेकिंग विश्वविद्यालय आदि की 107 पेज की तकनीकी समीक्षा साझा कर रहा हूँ, जिसका शीर्षक है "AI एजेंटों के युग में मेमोरी: एक सर्वेक्षण फॉर्म, फ़ंक्शन और डायनेमिक्स"।

प्रोजेक्ट एड्रेस: https://github.com/Shichun-Liu/Agent-Memory-Paper-List

पेपर एड्रेस: https://arxiv.org/pdf/2512.13564

पिछले दो वर्षों में, हमने बड़े भाषा मॉडल (LLM) से AI एजेंटों (AI Agents) के आश्चर्यजनक विकास को देखा है। डीप रिसर्च से लेकर सॉफ्टवेयर इंजीनियरिंग तक, वैज्ञानिक खोज से लेकर बहु-एजेंट सहयोग तक, ये बुनियादी मॉडल-आधारित एजेंट कृत्रिम सामान्य बुद्धिमत्ता (AGI) की सीमाओं को आगे बढ़ा रहे हैं।

लेकिन एक मुख्य प्रश्न उठता है: स्थिर LLM पैरामीटर को जल्दी से अपडेट नहीं किया जा सकता है, एजेंटों को निरंतर सीखने और अनुकूलन करने की क्षमता कैसे दी जाए?

उत्तर है - मेमोरी (Memory)।

"मेमोरी स्थिर LLM को एक ऐसे एजेंट में बदलने की महत्वपूर्ण क्षमता है जो पर्यावरण के साथ बातचीत के माध्यम से लगातार अनुकूलन करने में सक्षम है।"

Figure 1 पेपर द्वारा प्रस्तावित एकीकृत वर्गीकरण ढांचे को दर्शाता है, जो एजेंट मेमोरी को फॉर्म (Forms), फ़ंक्शन (Functions) और डायनेमिक्स (Dynamics) के तीन आयामों के अनुसार व्यवस्थित करता है, और इस वर्गीकरण प्रणाली में प्रतिनिधि प्रणालियों को मैप करता है।

पेपर एजेंट मेमोरी और कुछ निकट से संबंधित लेकिन अनिवार्य रूप से अलग अवधारणाओं के बीच स्पष्ट रूप से अंतर करता है: LLM मेमोरी, पुनर्प्राप्ति संवर्धित पीढ़ी (RAG) और संदर्भ इंजीनियरिंग। हालांकि वे सभी जानकारी के भंडारण और उपयोग से संबंधित हैं, लेकिन लक्ष्य, तंत्र और अनुप्रयोग परिदृश्यों में महत्वपूर्ण अंतर हैं।

एजेंट मेमोरी तकनीक

Self-Evolving Memory: Memento, H2R
Multimodal Memory: Ella, ViloMem, M3-Agent
Latent Memory: MemoryLLM, M+, MemGen
Parametric Memory: Retroformer, Early experience
RL-enabled Memory: MemAgent, RMM, MemSearcher, MEM1, Mem-alpha, Memory-R1

एजेंट मेमोरी बनाम RAG

RAG से संबंधित तकनीक:

Modular RAG: FlashRAG, ComposeRAG
Graph RAG: LightRAG, HippoRAG
Agentic RAG: PlanRAG, Self-RAG

RAG और एजेंट मेमोरी दोनों में मॉडल क्षमताओं को बढ़ाने के लिए बाहरी स्टोरेज से जानकारी प्राप्त करना शामिल है, लेकिन दोनों के डिजाइन दर्शन में एक मौलिक अंतर है:

विशेषताएँ RAG एजेंट मेमोरी मुख्य लक्ष्य वर्तमान क्वेरी के लिए प्रासंगिक पृष्ठभूमि ज्ञान समर्थन प्रदान करना समय के साथ निरंतर सीखने और अनुकूली व्यवहार जानकारी का स्रोत आमतौर पर स्थिर, पूर्व-निर्मित ज्ञान आधार गतिशील रूप से उत्पन्न, एजेंट के अपने इंटरैक्टिव अनुभव से व्यक्तिगत जानकारी पुनर्प्राप्ति ट्रिगर उपयोगकर्ता क्वेरी द्वारा निष्क्रिय रूप से ट्रिगर किया गया एजेंट द्वारा सक्रिय रूप से यह तय करना कि कब, क्या पुनर्प्राप्त करना है जानकारी अपडेट ज्ञान आधार आमतौर पर ऑफ़लाइन अपडेट किया जाता है ऑनलाइन, लगातार, चुनिंदा रूप से अपडेट किया जाता है प्रतिक्रिया लूप कोई प्रत्यक्ष प्रतिक्रिया तंत्र नहीं पर्यावरण के साथ बातचीत एक बंद लूप बनाती है

मुख्य अंतर: RAG एक ज्ञान विस्तार उपकरण है, जबकि एजेंट मेमोरी एक सीखने का तंत्र है। RAG उत्तर देता है "मुझे क्या पता है", एजेंट मेमोरी उत्तर देता है "मैंने क्या सीखा है"।

एजेंट मेमोरी बनाम LLM मेमोरी

LLM मेमोरी से संबंधित तकनीक:

Attention KV management: Mixture-of-Memory
Long context processing: Mamba, Memformer, MoA, Sparseformer, NSA

आयाम LLM मेमोरी एजेंट मेमोरी परिभाषा मॉडल पैरामीटर में आंतरिक ज्ञान, या संदर्भ विंडो में अस्थायी जानकारी एजेंटों को पर्यावरण के साथ लगातार बातचीत, क्रॉस-टास्क लर्निंग और दीर्घकालिक अनुकूलन का समर्थन करने वाली बाहरी प्रणाली समय पैमाना पूर्व-प्रशिक्षण डेटा या वर्तमान वार्तालाप संदर्भ तक सीमित कई कार्यों, सत्रों में फैला हुआ, आजीवन सीखने का समर्थन करता है अपडेट करने की क्षमता पैरामीटर अपडेट की लागत अधिक है, संदर्भ जानकारी अस्थिर है कुशल, चुनिंदा गतिशील अपडेट और विकास का समर्थन करता है सक्रियता निष्क्रिय रूप से क्वेरी का जवाब देना सक्रिय रूप से यह तय करना कि क्या जानकारी संग्रहीत, अपडेट, पुनर्प्राप्त करनी है पर्यावरण के साथ युग्मन पर्यावरण के साथ कोई सीधा संपर्क नहीं पर्यावरण प्रतिक्रिया के साथ गहराई से एकीकृत, इंटरैक्टिव सीखने का समर्थन करता है

मुख्य अंतर: LLM मेमोरी अनिवार्य रूप से स्थिर (पैरामीटर तय) या अस्थायी (संदर्भ सीमित) है, जबकि एजेंट मेमोरी गतिशील, स्थायी, पर्यावरण युग्मित है।

एजेंट मेमोरी बनाम संदर्भ इंजीनियरिंग

संदर्भ इंजीनियरिंग से संबंधित तकनीक:

Tool-integrated reasoning: ReTool, ToolLLM, Toolformer, VTool-R1, ToRL
Tool selection: AutoTool, VisTA
Communication protocol: ANP, A2A, MCP, Agora

पहलू संदर्भ इंजीनियरिंग एजेंट मेमोरी ध्यान केंद्रित करना एकल-मोड़ या वर्तमान कार्य के लिए इनपुट अनुकूलन बहु-मोड़, बहु-कार्य जानकारी का स्थायीकरण और उपयोग समय आयाम वर्तमान सत्र लंबा इतिहास जानकारी चयन मैन्युअल रूप से डिज़ाइन किए गए या अनुमानी नियम स्वचालित गठन, विकास, पुनर्प्राप्ति तंत्र स्थिति प्रबंधन कोई स्थायी स्थिति नहीं स्पष्ट रूप से विकसित होने योग्य मेमोरी स्थिति बनाए रखता है

मुख्य अंतर: संदर्भ इंजीनियरिंग एक प्रॉम्प्ट ऑप्टिमाइजेशन तकनीक है, एजेंट मेमोरी एक स्टेट मैनेजमेंट सिस्टम है। पहला ध्यान केंद्रित करता है "अब क्या इनपुट करें", दूसरा ध्यान केंद्रित करता है "अतीत में क्या याद रखा गया, यह वर्तमान और भविष्य को कैसे प्रभावित करता है"।

एक 107 पेज RAG और एजेंट और LLM मेमोरी की समीक्षा

एजेंट मेमोरी तकनीक

एजेंट मेमोरी बनाम RAG

एजेंट मेमोरी बनाम LLM मेमोरी

एजेंट मेमोरी बनाम संदर्भ इंजीनियरिंग

You Might Also Like

Claude Code Buddy संशोधन गाइड: कैसे प्राप्त करें चमकदार किंवदंती स्तर का पालतू

Obsidian ने Defuddle लॉन्च किया, Obsidian Web Clipper को एक नए स्तर पर ले गया

2026, खुद को 'स्वायत्त' करने के लिए मजबूर नहीं! ये 8 छोटी बातें करें, स्वास्थ्य स्वाभाविक रूप से आएगा

वे माताएँ जो वजन कम करने की कोशिश कर रही हैं लेकिन सफल नहीं हो रही हैं, निश्चित रूप से यहाँ फंस गई हैं

AI ब्राउज़र 24 घंटे स्थिर संचालन गाइड