एक 107 पेज RAG और एजेंट और LLM मेमोरी की समीक्षा

2/15/2026
4 min read

आज मैं रेन्मिन विश्वविद्यालय, फुडान विश्वविद्यालय, पेकिंग विश्वविद्यालय आदि की 107 पेज की तकनीकी समीक्षा साझा कर रहा हूँ, जिसका शीर्षक है "AI एजेंटों के युग में मेमोरी: एक सर्वेक्षण फॉर्म, फ़ंक्शन और डायनेमिक्स"।

प्रोजेक्ट एड्रेस: https://github.com/Shichun-Liu/Agent-Memory-Paper-List

पेपर एड्रेस: https://arxiv.org/pdf/2512.13564

पिछले दो वर्षों में, हमने बड़े भाषा मॉडल (LLM) से AI एजेंटों (AI Agents) के आश्चर्यजनक विकास को देखा है। डीप रिसर्च से लेकर सॉफ्टवेयर इंजीनियरिंग तक, वैज्ञानिक खोज से लेकर बहु-एजेंट सहयोग तक, ये बुनियादी मॉडल-आधारित एजेंट कृत्रिम सामान्य बुद्धिमत्ता (AGI) की सीमाओं को आगे बढ़ा रहे हैं।

लेकिन एक मुख्य प्रश्न उठता है: स्थिर LLM पैरामीटर को जल्दी से अपडेट नहीं किया जा सकता है, एजेंटों को निरंतर सीखने और अनुकूलन करने की क्षमता कैसे दी जाए?

उत्तर है - मेमोरी (Memory)

"मेमोरी स्थिर LLM को एक ऐसे एजेंट में बदलने की महत्वपूर्ण क्षमता है जो पर्यावरण के साथ बातचीत के माध्यम से लगातार अनुकूलन करने में सक्षम है।"

Figure 1 पेपर द्वारा प्रस्तावित एकीकृत वर्गीकरण ढांचे को दर्शाता है, जो एजेंट मेमोरी को फॉर्म (Forms), फ़ंक्शन (Functions) और डायनेमिक्स (Dynamics) के तीन आयामों के अनुसार व्यवस्थित करता है, और इस वर्गीकरण प्रणाली में प्रतिनिधि प्रणालियों को मैप करता है।

पेपर एजेंट मेमोरी और कुछ निकट से संबंधित लेकिन अनिवार्य रूप से अलग अवधारणाओं के बीच स्पष्ट रूप से अंतर करता है: LLM मेमोरी, पुनर्प्राप्ति संवर्धित पीढ़ी (RAG) और संदर्भ इंजीनियरिंग। हालांकि वे सभी जानकारी के भंडारण और उपयोग से संबंधित हैं, लेकिन लक्ष्य, तंत्र और अनुप्रयोग परिदृश्यों में महत्वपूर्ण अंतर हैं।

एजेंट मेमोरी तकनीक

  • Self-Evolving Memory: Memento, H2R

  • Multimodal Memory: Ella, ViloMem, M3-Agent

  • Latent Memory: MemoryLLM, M+, MemGen

  • Parametric Memory: Retroformer, Early experience

  • RL-enabled Memory: MemAgent, RMM, MemSearcher, MEM1, Mem-alpha, Memory-R1

एजेंट मेमोरी बनाम RAG

RAG से संबंधित तकनीक:

  • Modular RAG: FlashRAG, ComposeRAG

  • Graph RAG: LightRAG, HippoRAG

  • Agentic RAG: PlanRAG, Self-RAG

RAG और एजेंट मेमोरी दोनों में मॉडल क्षमताओं को बढ़ाने के लिए बाहरी स्टोरेज से जानकारी प्राप्त करना शामिल है, लेकिन दोनों के डिजाइन दर्शन में एक मौलिक अंतर है:

विशेषताएँ RAG एजेंट मेमोरी मुख्य लक्ष्य वर्तमान क्वेरी के लिए प्रासंगिक पृष्ठभूमि ज्ञान समर्थन प्रदान करना समय के साथ निरंतर सीखने और अनुकूली व्यवहार जानकारी का स्रोत आमतौर पर स्थिर, पूर्व-निर्मित ज्ञान आधार गतिशील रूप से उत्पन्न, एजेंट के अपने इंटरैक्टिव अनुभव से व्यक्तिगत जानकारी पुनर्प्राप्ति ट्रिगर उपयोगकर्ता क्वेरी द्वारा निष्क्रिय रूप से ट्रिगर किया गया एजेंट द्वारा सक्रिय रूप से यह तय करना कि कब, क्या पुनर्प्राप्त करना है जानकारी अपडेट ज्ञान आधार आमतौर पर ऑफ़लाइन अपडेट किया जाता है ऑनलाइन, लगातार, चुनिंदा रूप से अपडेट किया जाता है प्रतिक्रिया लूप कोई प्रत्यक्ष प्रतिक्रिया तंत्र नहीं पर्यावरण के साथ बातचीत एक बंद लूप बनाती है

मुख्य अंतर: RAG एक ज्ञान विस्तार उपकरण है, जबकि एजेंट मेमोरी एक सीखने का तंत्र है। RAG उत्तर देता है "मुझे क्या पता है", एजेंट मेमोरी उत्तर देता है "मैंने क्या सीखा है"।

एजेंट मेमोरी बनाम LLM मेमोरी

LLM मेमोरी से संबंधित तकनीक:

  • Attention KV management: Mixture-of-Memory

  • Long context processing: Mamba, Memformer, MoA, Sparseformer, NSA

आयाम LLM मेमोरी एजेंट मेमोरी परिभाषा मॉडल पैरामीटर में आंतरिक ज्ञान, या संदर्भ विंडो में अस्थायी जानकारी एजेंटों को पर्यावरण के साथ लगातार बातचीत, क्रॉस-टास्क लर्निंग और दीर्घकालिक अनुकूलन का समर्थन करने वाली बाहरी प्रणाली समय पैमाना पूर्व-प्रशिक्षण डेटा या वर्तमान वार्तालाप संदर्भ तक सीमित कई कार्यों, सत्रों में फैला हुआ, आजीवन सीखने का समर्थन करता है अपडेट करने की क्षमता पैरामीटर अपडेट की लागत अधिक है, संदर्भ जानकारी अस्थिर है कुशल, चुनिंदा गतिशील अपडेट और विकास का समर्थन करता है सक्रियता निष्क्रिय रूप से क्वेरी का जवाब देना सक्रिय रूप से यह तय करना कि क्या जानकारी संग्रहीत, अपडेट, पुनर्प्राप्त करनी है पर्यावरण के साथ युग्मन पर्यावरण के साथ कोई सीधा संपर्क नहीं पर्यावरण प्रतिक्रिया के साथ गहराई से एकीकृत, इंटरैक्टिव सीखने का समर्थन करता है

मुख्य अंतर: LLM मेमोरी अनिवार्य रूप से स्थिर (पैरामीटर तय) या अस्थायी (संदर्भ सीमित) है, जबकि एजेंट मेमोरी गतिशील, स्थायी, पर्यावरण युग्मित है।

एजेंट मेमोरी बनाम संदर्भ इंजीनियरिंग

संदर्भ इंजीनियरिंग से संबंधित तकनीक:

  • Tool-integrated reasoning: ReTool, ToolLLM, Toolformer, VTool-R1, ToRL

  • Tool selection: AutoTool, VisTA

  • Communication protocol: ANP, A2A, MCP, Agora

पहलू संदर्भ इंजीनियरिंग एजेंट मेमोरी ध्यान केंद्रित करना एकल-मोड़ या वर्तमान कार्य के लिए इनपुट अनुकूलन बहु-मोड़, बहु-कार्य जानकारी का स्थायीकरण और उपयोग समय आयाम वर्तमान सत्र लंबा इतिहास जानकारी चयन मैन्युअल रूप से डिज़ाइन किए गए या अनुमानी नियम स्वचालित गठन, विकास, पुनर्प्राप्ति तंत्र स्थिति प्रबंधन कोई स्थायी स्थिति नहीं स्पष्ट रूप से विकसित होने योग्य मेमोरी स्थिति बनाए रखता है

मुख्य अंतर: संदर्भ इंजीनियरिंग एक प्रॉम्प्ट ऑप्टिमाइजेशन तकनीक है, एजेंट मेमोरी एक स्टेट मैनेजमेंट सिस्टम है। पहला ध्यान केंद्रित करता है "अब क्या इनपुट करें", दूसरा ध्यान केंद्रित करता है "अतीत में क्या याद रखा गया, यह वर्तमान और भविष्य को कैसे प्रभावित करता है"।

Published in Technology

You Might Also Like

📝
Technology

Claude Code Buddy संशोधन गाइड: कैसे प्राप्त करें चमकदार किंवदंती स्तर का पालतू

Claude Code Buddy संशोधन गाइड: कैसे प्राप्त करें चमकदार किंवदंती स्तर का पालतू 2026年4月1日,Anthropic 在 Claude Code 2.1.89 ...

Obsidian ने Defuddle लॉन्च किया, Obsidian Web Clipper को एक नए स्तर पर ले गयाTechnology

Obsidian ने Defuddle लॉन्च किया, Obsidian Web Clipper को एक नए स्तर पर ले गया

Obsidian ने Defuddle लॉन्च किया, Obsidian Web Clipper को एक नए स्तर पर ले गया मैं हमेशा Obsidian के मूल विचार को पसंद क...

OpenAI अचानक घोषणा करता है "तीन-इन-एक": ब्राउज़र + प्रोग्रामिंग + ChatGPT का विलय, आंतरिक रूप से स्वीकार किया कि पिछले वर्ष गलत दिशा में बढ़ाTechnology

OpenAI अचानक घोषणा करता है "तीन-इन-एक": ब्राउज़र + प्रोग्रामिंग + ChatGPT का विलय, आंतरिक रूप से स्वीकार किया कि पिछले वर्ष गलत दिशा में बढ़ा

OpenAI अचानक घोषणा करता है "तीन-इन-एक": ब्राउज़र + प्रोग्रामिंग + ChatGPT का विलय, आंतरिक रूप से स्वीकार किया कि पिछले व...

2026, खुद को 'स्वायत्त' करने के लिए मजबूर नहीं! ये 8 छोटी बातें करें, स्वास्थ्य स्वाभाविक रूप से आएगाHealth

2026, खुद को 'स्वायत्त' करने के लिए मजबूर नहीं! ये 8 छोटी बातें करें, स्वास्थ्य स्वाभाविक रूप से आएगा

2026, खुद को 'स्वायत्त' करने के लिए मजबूर नहीं! ये 8 छोटी बातें करें, स्वास्थ्य स्वाभाविक रूप से आएगा नए साल की शुरुआत,...

वे माताएँ जो वजन कम करने की कोशिश कर रही हैं लेकिन सफल नहीं हो रही हैं, निश्चित रूप से यहाँ फंस गई हैंHealth

वे माताएँ जो वजन कम करने की कोशिश कर रही हैं लेकिन सफल नहीं हो रही हैं, निश्चित रूप से यहाँ फंस गई हैं

वे माताएँ जो वजन कम करने की कोशिश कर रही हैं लेकिन सफल नहीं हो रही हैं, निश्चित रूप से यहाँ फंस गई हैं मार्च का आधा मही...

📝
Technology

AI ब्राउज़र 24 घंटे स्थिर संचालन गाइड

AI ब्राउज़र 24 घंटे स्थिर संचालन गाइड यह ट्यूटोरियल एक स्थिर, दीर्घकालिक AI ब्राउज़र वातावरण स्थापित करने के तरीके को प्...