ਇੱਕ 107 ਸਫ਼ਿਆਂ ਦੀ RAG ਅਤੇ ਏਜੰਟ ਅਤੇ LLM ਮੈਮੋਰੀ ਸਮੀਖਿਆ

ਅੱਜ ਮੈਂ ਰੇਨਮਿਨ ਯੂਨੀਵਰਸਿਟੀ, ਫੁਡਾਨ ਯੂਨੀਵਰਸਿਟੀ, ਪੇਕਿੰਗ ਯੂਨੀਵਰਸਿਟੀ ਆਦਿ ਦੁਆਰਾ 107 ਸਫ਼ਿਆਂ ਦੀ ਤਕਨੀਕੀ ਸਮੀਖਿਆ ਸਾਂਝੀ ਕਰ ਰਿਹਾ ਹਾਂ, ਜਿਸਦਾ ਸਿਰਲੇਖ ਹੈ "AI ਏਜੰਟਾਂ ਦੇ ਯੁੱਗ ਵਿੱਚ ਮੈਮੋਰੀ: ਇੱਕ ਸਰਵੇਖਣ ਫਾਰਮ, ਫੰਕਸ਼ਨ ਅਤੇ ਡਾਇਨਾਮਿਕਸ"।

ਪ੍ਰੋਜੈਕਟ ਦਾ ਪਤਾ: https://github.com/Shichun-Liu/Agent-Memory-Paper-List

ਪੇਪਰ ਦਾ ਪਤਾ: https://arxiv.org/pdf/2512.13564

ਪਿਛਲੇ ਦੋ ਸਾਲਾਂ ਵਿੱਚ, ਅਸੀਂ ਵੱਡੇ ਭਾਸ਼ਾ ਮਾਡਲਾਂ (LLMs) ਤੋਂ AI ਬੁੱਧੀਮਾਨ ਏਜੰਟਾਂ (AI Agents) ਵਿੱਚ ਸ਼ਾਨਦਾਰ ਵਿਕਾਸ ਦੇਖਿਆ ਹੈ। ਡੀਪ ਰਿਸਰਚ ਤੋਂ ਲੈ ਕੇ ਸਾਫਟਵੇਅਰ ਇੰਜੀਨੀਅਰਿੰਗ ਤੱਕ, ਵਿਗਿਆਨਕ ਖੋਜ ਤੋਂ ਲੈ ਕੇ ਮਲਟੀ-ਏਜੰਟ ਸਹਿਯੋਗ ਤੱਕ, ਇਹ ਬੁਨਿਆਦੀ ਮਾਡਲ-ਅਧਾਰਤ ਏਜੰਟ ਆਰਟੀਫੀਸ਼ੀਅਲ ਜਨਰਲ ਇੰਟੈਲੀਜੈਂਸ (AGI) ਦੀਆਂ ਸੀਮਾਵਾਂ ਨੂੰ ਅੱਗੇ ਵਧਾ ਰਹੇ ਹਨ।

ਪਰ ਇੱਕ ਮੁੱਖ ਸਵਾਲ ਉੱਠਦਾ ਹੈ: ਸਥਿਰ LLM ਪੈਰਾਮੀਟਰਾਂ ਨੂੰ ਤੇਜ਼ੀ ਨਾਲ ਅੱਪਡੇਟ ਨਹੀਂ ਕੀਤਾ ਜਾ ਸਕਦਾ, ਏਜੰਟਾਂ ਨੂੰ ਨਿਰੰਤਰ ਸਿੱਖਣ ਅਤੇ ਅਨੁਕੂਲ ਹੋਣ ਦੀ ਸਮਰੱਥਾ ਕਿਵੇਂ ਦਿੱਤੀ ਜਾਵੇ?

ਜਵਾਬ ਹੈ - ਮੈਮੋਰੀ (Memory)।

"ਮੈਮੋਰੀ ਇੱਕ ਸਥਿਰ LLM ਨੂੰ ਇੱਕ ਬੁੱਧੀਮਾਨ ਏਜੰਟ ਵਿੱਚ ਬਦਲਣ ਦੀ ਕੁੰਜੀ ਹੈ ਜੋ ਵਾਤਾਵਰਣ ਨਾਲ ਗੱਲਬਾਤ ਦੁਆਰਾ ਲਗਾਤਾਰ ਅਨੁਕੂਲ ਹੋਣ ਦੇ ਸਮਰੱਥ ਹੈ।"

ਚਿੱਤਰ 1 ਪੇਪਰ ਦੁਆਰਾ ਪ੍ਰਸਤਾਵਿਤ ਇੱਕਸਾਰ ਵਰਗੀਕਰਨ ਫਰੇਮਵਰਕ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ, ਜੋ ਏਜੰਟ ਮੈਮੋਰੀ ਨੂੰ ਫਾਰਮ (Forms), ਫੰਕਸ਼ਨ (Functions), ਅਤੇ ਡਾਇਨਾਮਿਕਸ (Dynamics) ਦੇ ਤਿੰਨ ਪਹਿਲੂਆਂ ਦੇ ਅਨੁਸਾਰ ਸੰਗਠਿਤ ਕਰਦਾ ਹੈ, ਅਤੇ ਪ੍ਰਤੀਨਿਧੀ ਪ੍ਰਣਾਲੀਆਂ ਨੂੰ ਇਸ ਵਰਗੀਕਰਨ ਪ੍ਰਣਾਲੀ ਵਿੱਚ ਮੈਪ ਕਰਦਾ ਹੈ।

ਪੇਪਰ ਏਜੰਟ ਮੈਮੋਰੀ ਅਤੇ ਕਈ ਨਜ਼ਦੀਕੀ ਸਬੰਧਤ ਪਰ ਜ਼ਰੂਰੀ ਤੌਰ 'ਤੇ ਵੱਖਰੀਆਂ ਧਾਰਨਾਵਾਂ ਵਿੱਚ ਵੀ ਸਪੱਸ਼ਟ ਤੌਰ 'ਤੇ ਅੰਤਰ ਕਰਦਾ ਹੈ: LLM ਮੈਮੋਰੀ, ਰੀਟਰੀਵਲ ਔਗਮੈਂਟਡ ਜਨਰੇਸ਼ਨ (RAG), ਅਤੇ ਸੰਦਰਭ ਇੰਜੀਨੀਅਰਿੰਗ। ਹਾਲਾਂਕਿ ਇਹ ਸਾਰੇ ਜਾਣਕਾਰੀ ਦੇ ਸਟੋਰੇਜ ਅਤੇ ਉਪਯੋਗ ਨਾਲ ਸਬੰਧਤ ਹਨ, ਪਰ ਟੀਚਿਆਂ, ਵਿਧੀਵਾਂ ਅਤੇ ਐਪਲੀਕੇਸ਼ਨ ਦ੍ਰਿਸ਼ਾਂ ਵਿੱਚ ਮੁੱਖ ਅੰਤਰ ਹਨ।

ਬੁੱਧੀਮਾਨ ਏਜੰਟ ਮੈਮੋਰੀ ਤਕਨਾਲੋਜੀ

Self-Evolving Memory: Memento, H2R
Multimodal Memory: Ella, ViloMem, M3-Agent
Latent Memory: MemoryLLM, M+, MemGen
Parametric Memory: Retroformer, Early experience
RL-enabled Memory: MemAgent, RMM, MemSearcher, MEM1, Mem-alpha, Memory-R1

ਬੁੱਧੀਮਾਨ ਏਜੰਟ ਮੈਮੋਰੀ ਬਨਾਮ RAG

RAG ਨਾਲ ਸਬੰਧਤ ਤਕਨਾਲੋਜੀਆਂ:

Modular RAG: FlashRAG, ComposeRAG
Graph RAG: LightRAG, HippoRAG
Agentic RAG: PlanRAG, Self-RAG

RAG ਅਤੇ ਬੁੱਧੀਮਾਨ ਏਜੰਟ ਮੈਮੋਰੀ ਦੋਵਾਂ ਵਿੱਚ ਮਾਡਲ ਸਮਰੱਥਾਵਾਂ ਨੂੰ ਵਧਾਉਣ ਲਈ ਬਾਹਰੀ ਸਟੋਰੇਜ ਤੋਂ ਜਾਣਕਾਰੀ ਪ੍ਰਾਪਤ ਕਰਨਾ ਸ਼ਾਮਲ ਹੈ, ਪਰ ਦੋਵਾਂ ਦੇ ਡਿਜ਼ਾਈਨ ਫ਼ਲਸਫ਼ੇ ਵਿੱਚ ਇੱਕ ਜ਼ਰੂਰੀ ਅੰਤਰ ਹੈ:

ਵਿਸ਼ੇਸ਼ਤਾ RAG ਬੁੱਧੀਮਾਨ ਏਜੰਟ ਮੈਮੋਰੀ ਮੁੱਖ ਟੀਚਾ ਮੌਜੂਦਾ ਪੁੱਛਗਿੱਛ ਲਈ ਸੰਬੰਧਿਤ ਪਿਛੋਕੜ ਜਾਣਕਾਰੀ ਸਹਾਇਤਾ ਪ੍ਰਦਾਨ ਕਰਨਾ ਸਮੇਂ ਦੇ ਨਾਲ ਨਿਰੰਤਰ ਸਿੱਖਣ ਅਤੇ ਸਵੈ-ਅਨੁਕੂਲ ਵਿਵਹਾਰ ਜਾਣਕਾਰੀ ਦਾ ਸਰੋਤ ਆਮ ਤੌਰ 'ਤੇ ਸਥਿਰ, ਪੂਰਵ-ਬਣਾਇਆ ਗਿਆ ਗਿਆਨ ਅਧਾਰ ਗਤੀਸ਼ੀਲ ਤੌਰ 'ਤੇ ਤਿਆਰ ਕੀਤਾ ਗਿਆ, ਏਜੰਟ ਦੇ ਆਪਣੇ ਪਰਸਪਰ ਪ੍ਰਭਾਵ ਅਨੁਭਵ ਤੋਂ ਵਿਅਕਤੀਗਤ ਜਾਣਕਾਰੀ ਪ੍ਰਾਪਤੀ ਟਰਿੱਗਰ ਉਪਭੋਗਤਾ ਪੁੱਛਗਿੱਛ ਦੁਆਰਾ ਪੈਸਿਵ ਟਰਿੱਗਰ ਏਜੰਟ ਦੁਆਰਾ ਸਰਗਰਮੀ ਨਾਲ ਇਹ ਫੈਸਲਾ ਕਰਨਾ ਕਿ ਕਦੋਂ, ਕੀ ਪ੍ਰਾਪਤ ਕਰਨਾ ਹੈ ਜਾਣਕਾਰੀ ਅੱਪਡੇਟ ਗਿਆਨ ਅਧਾਰ ਆਮ ਤੌਰ 'ਤੇ ਔਫਲਾਈਨ ਅੱਪਡੇਟ ਕੀਤਾ ਜਾਂਦਾ ਹੈ ਔਨਲਾਈਨ, ਨਿਰੰਤਰ, ਚੋਣਵੇਂ ਤੌਰ 'ਤੇ ਅੱਪਡੇਟ ਕੀਤਾ ਜਾਂਦਾ ਹੈ ਫੀਡਬੈਕ ਲੂਪ ਵਾਤਾਵਰਣ ਨਾਲ ਪਰਸਪਰ ਪ੍ਰਭਾਵ ਦੁਆਰਾ ਬੰਦ ਲੂਪ ਬਣਾਉਣ ਲਈ ਕੋਈ ਸਿੱਧਾ ਫੀਡਬੈਕ ਵਿਧੀ ਨਹੀਂ

ਮੁੱਖ ਅੰਤਰ: RAG ਇੱਕ ਗਿਆਨ ਵਿਸਤਾਰ ਸਾਧਨ ਹੈ, ਜਦੋਂ ਕਿ ਬੁੱਧੀਮਾਨ ਏਜੰਟ ਮੈਮੋਰੀ ਇੱਕ ਸਿੱਖਣ ਵਿਧੀ ਹੈ। RAG ਜਵਾਬ ਦਿੰਦਾ ਹੈ "ਮੈਂ ਕੀ ਜਾਣਦਾ ਹਾਂ", ਬੁੱਧੀਮਾਨ ਏਜੰਟ ਮੈਮੋਰੀ ਜਵਾਬ ਦਿੰਦਾ ਹੈ "ਮੈਂ ਕੀ ਸਿੱਖਿਆ ਹੈ"।

ਬੁੱਧੀਮਾਨ ਏਜੰਟ ਮੈਮੋਰੀ ਬਨਾਮ LLM ਮੈਮੋਰੀ

LLM ਮੈਮੋਰੀ ਨਾਲ ਸਬੰਧਤ ਤਕਨਾਲੋਜੀਆਂ:

Attention KV management: Mixture-of-Memory
Long context processing: Mamba, Memformer, MoA, Sparseformer, NSA

ਪਹਿਲੂ LLM ਮੈਮੋਰੀ ਬੁੱਧੀਮਾਨ ਏਜੰਟ ਮੈਮੋਰੀ ਪਰਿਭਾਸ਼ਾ ਮਾਡਲ ਪੈਰਾਮੀਟਰਾਂ ਵਿੱਚ ਅੰਦਰੂਨੀ ਗਿਆਨ, ਜਾਂ ਸੰਦਰਭ ਵਿੰਡੋ ਵਿੱਚ ਅਸਥਾਈ ਜਾਣਕਾਰੀ ਵਾਤਾਵਰਣ ਨਾਲ ਨਿਰੰਤਰ ਪਰਸਪਰ ਪ੍ਰਭਾਵ, ਕਾਰਜਾਂ ਵਿੱਚ ਸਿੱਖਣ ਅਤੇ ਲੰਬੇ ਸਮੇਂ ਦੇ ਅਨੁਕੂਲਤਾ ਦਾ ਸਮਰਥਨ ਕਰਨ ਵਾਲੀ ਬਾਹਰੀ ਪ੍ਰਣਾਲੀ ਸਮਾਂ ਸਕੇਲ ਪੂਰਵ-ਸਿਖਲਾਈ ਡੇਟਾ ਜਾਂ ਮੌਜੂਦਾ ਗੱਲਬਾਤ ਸੰਦਰਭ ਤੱਕ ਸੀਮਿਤ ਕਈ ਕਾਰਜਾਂ, ਸੈਸ਼ਨਾਂ ਵਿੱਚ ਫੈਲਿਆ ਹੋਇਆ, ਜੀਵਨ ਭਰ ਸਿੱਖਣ ਦਾ ਸਮਰਥਨ ਕਰਦਾ ਹੈ ਅੱਪਡੇਟ ਕਰਨ ਦੀ ਯੋਗਤਾ ਪੈਰਾਮੀਟਰ ਅੱਪਡੇਟ ਦੀ ਲਾਗਤ ਬਹੁਤ ਜ਼ਿਆਦਾ ਹੈ, ਸੰਦਰਭ ਜਾਣਕਾਰੀ ਅਸਥਿਰ ਹੈ ਕੁਸ਼ਲ, ਚੋਣਵੇਂ ਗਤੀਸ਼ੀਲ ਅੱਪਡੇਟ ਅਤੇ ਵਿਕਾਸ ਦਾ ਸਮਰਥਨ ਕਰਦਾ ਹੈ ਸਰਗਰਮੀ ਪੁੱਛਗਿੱਛਾਂ ਦਾ ਪੈਸਿਵ ਜਵਾਬ ਸਰਗਰਮੀ ਨਾਲ ਇਹ ਫੈਸਲਾ ਕਰਨਾ ਕਿ ਕੀ ਜਾਣਕਾਰੀ ਸਟੋਰ ਕਰਨੀ ਹੈ, ਅੱਪਡੇਟ ਕਰਨੀ ਹੈ, ਪ੍ਰਾਪਤ ਕਰਨੀ ਹੈ ਵਾਤਾਵਰਣ ਨਾਲ ਜੋੜੀ ਵਾਤਾਵਰਣ ਨਾਲ ਕੋਈ ਸਿੱਧਾ ਪਰਸਪਰ ਪ੍ਰਭਾਵ ਨਹੀਂ ਵਾਤਾਵਰਣ ਫੀਡਬੈਕ ਨਾਲ ਡੂੰਘਾਈ ਨਾਲ ਏਕੀਕ੍ਰਿਤ, ਪਰਸਪਰ ਪ੍ਰਭਾਵੀ ਸਿੱਖਣ ਦਾ ਸਮਰਥਨ ਕਰਦਾ ਹੈ

ਮੁੱਖ ਅੰਤਰ: LLM ਮੈਮੋਰੀ ਜ਼ਰੂਰੀ ਤੌਰ 'ਤੇ ਸਥਿਰ (ਪੈਰਾਮੀਟਰ ਸਥਿਰ) ਜਾਂ ਥੋੜ੍ਹੇ ਸਮੇਂ ਲਈ (ਸੰਦਰਭ ਸੀਮਤ) ਹੁੰਦੀ ਹੈ, ਜਦੋਂ ਕਿ ਬੁੱਧੀਮਾਨ ਏਜੰਟ ਮੈਮੋਰੀ ਗਤੀਸ਼ੀਲ, ਸਥਾਈ, ਵਾਤਾਵਰਣ ਨਾਲ ਜੋੜੀ ਹੁੰਦੀ ਹੈ।

ਬੁੱਧੀਮਾਨ ਏਜੰਟ ਮੈਮੋਰੀ ਬਨਾਮ ਸੰਦਰਭ ਇੰਜੀਨੀਅਰਿੰਗ

ਸੰਦਰਭ ਇੰਜੀਨੀਅਰਿੰਗ ਨਾਲ ਸਬੰਧਤ ਤਕਨਾਲੋਜੀਆਂ:

Tool-integrated reasoning: ReTool, ToolLLM, Toolformer, VTool-R1, ToRL
Tool selection: AutoTool, VisTA
Communication protocol: ANP, A2A, MCP, Agora

ਪਹਿਲੂ ਸੰਦਰਭ ਇੰਜੀਨੀਅਰਿੰਗ ਬੁੱਧੀਮਾਨ ਏਜੰਟ ਮੈਮੋਰੀ ਫੋਕਸ ਸਿੰਗਲ-ਰਾਊਂਡ ਜਾਂ ਮੌਜੂਦਾ ਕਾਰਜ ਲਈ ਇਨਪੁਟ ਅਨੁਕੂਲਤਾ ਕਈ ਰਾਊਂਡਾਂ, ਕਾਰਜਾਂ ਵਿੱਚ ਜਾਣਕਾਰੀ ਦਾ ਸਥਾਈਕਰਨ ਅਤੇ ਉਪਯੋਗ ਸਮਾਂ ਪਹਿਲੂ ਮੌਜੂਦਾ ਸੈਸ਼ਨ ਲੰਬਾ ਇਤਿਹਾਸ ਜਾਣਕਾਰੀ ਦੀ ਚੋਣ ਮਨੁੱਖੀ ਡਿਜ਼ਾਈਨ ਜਾਂ ਹੀਊਰਿਸਟਿਕ ਨਿਯਮ ਸਵੈਚਲਿਤ ਰੂਪ ਨਾਲ ਬਣਤਰ, ਵਿਕਾਸ, ਪ੍ਰਾਪਤੀ ਵਿਧੀ ਸਥਿਤੀ ਪ੍ਰਬੰਧਨ ਕੋਈ ਸਥਾਈ ਸਥਿਤੀ ਨਹੀਂ ਵਿਕਸਤ ਹੋਣ ਯੋਗ ਮੈਮੋਰੀ ਸਥਿਤੀ ਦੀ ਸਪੱਸ਼ਟ ਤੌਰ 'ਤੇ ਸਾਂਭ-ਸੰਭਾਲ

ਮੁੱਖ ਅੰਤਰ: ਸੰਦਰਭ ਇੰਜੀਨੀਅਰਿੰਗ ਇੱਕ ਪ੍ਰੋਂਪਟ ਅਨੁਕੂਲਤਾ ਤਕਨੀਕ ਹੈ, ਬੁੱਧੀਮਾਨ ਏਜੰਟ ਮੈਮੋਰੀ ਇੱਕ ਸਥਿਤੀ ਪ੍ਰਬੰਧਨ ਪ੍ਰਣਾਲੀ ਹੈ। ਪਹਿਲਾ ਇਸ ਗੱਲ 'ਤੇ ਧਿਆਨ ਕੇਂਦਰਤ ਕਰਦਾ ਹੈ ਕਿ "ਹੁਣ ਕੀ ਇਨਪੁਟ ਕਰਨਾ ਹੈ", ਬਾਅਦ ਵਾਲਾ ਇਸ ਗੱਲ 'ਤੇ ਧਿਆਨ ਕੇਂਦਰਤ ਕਰਦਾ ਹੈ ਕਿ "ਅਤੀਤ ਵਿੱਚ ਕੀ ਯਾਦ ਰੱਖਿਆ ਗਿਆ ਸੀ, ਇਹ ਹੁਣ ਅਤੇ ਭਵਿੱਖ ਨੂੰ ਕਿਵੇਂ ਪ੍ਰਭਾਵਿਤ ਕਰਦਾ ਹੈ"।

ਇੱਕ 107 ਸਫ਼ਿਆਂ ਦੀ RAG ਅਤੇ ਏਜੰਟ ਅਤੇ LLM ਮੈਮੋਰੀ ਸਮੀਖਿਆ

ਬੁੱਧੀਮਾਨ ਏਜੰਟ ਮੈਮੋਰੀ ਤਕਨਾਲੋਜੀ

ਬੁੱਧੀਮਾਨ ਏਜੰਟ ਮੈਮੋਰੀ ਬਨਾਮ RAG

ਬੁੱਧੀਮਾਨ ਏਜੰਟ ਮੈਮੋਰੀ ਬਨਾਮ LLM ਮੈਮੋਰੀ

ਬੁੱਧੀਮਾਨ ਏਜੰਟ ਮੈਮੋਰੀ ਬਨਾਮ ਸੰਦਰਭ ਇੰਜੀਨੀਅਰਿੰਗ

You Might Also Like

Claude Code Buddy ਸੋਧ ਗਾਈਡ: ਕਿਵੇਂ ਚਮਕਦਾਰ ਪੁਰਾਣੀ ਪਾਲਤੂ ਪ੍ਰਾਪਤ ਕਰੀਏ

Obsidian ਨੇ Defuddle ਜਾਰੀ ਕੀਤਾ, Obsidian Web Clipper ਨੂੰ ਇੱਕ ਨਵੇਂ ਉੱਚਾਈ 'ਤੇ ਲੈ ਗਿਆ

OpenAI اچانک "تین میں ایک" کا اعلان کرتا ہے: براؤزر + پروگرامنگ + ChatGPT کا انضمام، اندرونی طور پر تسلیم کیا کہ پچھلے سال غلط راستہ اختیار کیا گیا

2026, ਆਪਣੇ ਆਪ ਨੂੰ "ਆਤਮ-ਨਿਯੰਤਰਣ" ਕਰਨ ਲਈ ਦਬਾਉ ਨਾ ਦਿਓ! ਇਹ 8 ਛੋਟੇ ਕੰਮ ਕਰੋ, ਸਿਹਤ ਆਪ ਹੀ ਆਏਗੀ

ਉਹ ਮਾਂਵਾਂ ਜੋ ਵਜ਼ਨ ਘਟਾਉਣ ਲਈ ਕੋਸ਼ਿਸ਼ ਕਰਦੀਆਂ ਹਨ, ਪਰ ਫਿਰ ਵੀ ਘਟ ਨਹੀਂ ਪਾਉਂਦੀਆਂ, ਇਹਨਾਂ ਨੂੰ ਇੱਥੇ ਹੀ ਫਸਣਾ ਪੈਂਦਾ ਹੈ

AI Browser 24 ਘੰਟੇ ਸਥਿਰ ਚਾਲੂ ਰੱਖਣ ਦੀ ਗਾਈਡ