107 பக்க RAG மற்றும் Agent&LLM நினைவகத்தின் ஆய்வு
2/15/2026
4 min read
இன்று, ரென்மின் பல்கலைக்கழகம், ஃபுடான் பல்கலைக்கழகம், பெக்கிங் பல்கலைக்கழகம் போன்றவற்றின் 107 பக்க தொழில்நுட்ப ஆய்வான "AI ஏஜென்ட்களின் காலத்தில் நினைவகம்: ஒரு ஆய்வு வடிவங்கள், செயல்பாடுகள் மற்றும் இயக்கவியல்" என்பதைப் பகிர்கிறேன்.
திட்ட முகவரி: https://github.com/Shichun-Liu/Agent-Memory-Paper-List
கட்டுரை முகவரி: https://arxiv.org/pdf/2512.13564
கடந்த இரண்டு ஆண்டுகளில், பெரிய மொழி மாதிரிகள் (LLM) AI ஏஜென்ட்களாக (AI Agents) வியக்கத்தக்க பரிணாமத்தை நாங்கள் கண்டோம். ஆழமான ஆராய்ச்சி முதல் மென்பொருள் பொறியியல் வரை, அறிவியல் கண்டுபிடிப்பு முதல் பல ஏஜென்ட் ஒத்துழைப்பு வரை, அடிப்படை மாதிரிகளை அடிப்படையாகக் கொண்ட இந்த ஏஜென்ட்கள் செயற்கை பொது நுண்ணறிவின் (AGI) எல்லைகளைத் தள்ளுகின்றன.
ஆனால் ஒரு முக்கிய கேள்வி எழுகிறது: **நிலையான LLM அளவுருக்களை விரைவாகப் புதுப்பிக்க முடியாது, ஏஜென்ட்களை எவ்வாறு தொடர்ச்சியான கற்றல் மற்றும் தழுவல் திறன்களைக் கொண்டிருக்கச் செய்வது?**
பதில் - **நினைவகம் (Memory)**.
> "நினைவகம் என்பது நிலையான LLM ஐ சுற்றுச்சூழலுடன் தொடர்பு கொண்டு தொடர்ந்து மாற்றியமைக்கக்கூடிய ஒரு ஏஜென்டாக மாற்றுவதற்கான முக்கிய திறனாகும்."
**Figure 1** கட்டுரையில் முன்மொழியப்பட்ட ஒருங்கிணைந்த வகைப்பாடு கட்டமைப்பைக் காட்டுகிறது, இது ஏஜென்ட் நினைவகத்தை **வடிவங்கள் (Forms)**, **செயல்பாடுகள் (Functions)**, **இயக்கவியல் (Dynamics)** ஆகிய மூன்று பரிமாணங்களின்படி ஒழுங்கமைக்கிறது மற்றும் பிரதிநிதித்துவ அமைப்புகளை இந்த வகைப்பாடு அமைப்பில் வரைபடமாக்குகிறது.
ஏஜென்ட் நினைவகம் மற்றும் நெருக்கமாக தொடர்புடைய ஆனால் அடிப்படையில் வேறுபட்ட கருத்துகளுக்கு இடையே உள்ள வேறுபாட்டை கட்டுரை தெளிவுபடுத்துகிறது: **LLM நினைவகம்**, **தேடல் மேம்படுத்தப்பட்ட உருவாக்கம் (RAG)** மற்றும் **சூழல் பொறியியல்**. அவை அனைத்தும் தகவல்களைச் சேமித்தல் மற்றும் பயன்படுத்துதல் ஆகியவற்றுடன் தொடர்புடையதாக இருந்தாலும், இலக்குகள், வழிமுறைகள் மற்றும் பயன்பாட்டு காட்சிகள் ஆகியவற்றில் முக்கியமான வேறுபாடுகள் உள்ளன.
## ஏஜென்ட் நினைவக தொழில்நுட்பம்
- **Self-Evolving Memory**: Memento, H2R
- **Multimodal Memory**: Ella, ViloMem, M3-Agent
- **Latent Memory**: MemoryLLM, M+, MemGen
- **Parametric Memory**: Retroformer, Early experience
- **RL-enabled Memory**: MemAgent, RMM, MemSearcher, MEM1, Mem-alpha, Memory-R1
## ஏஜென்ட் நினைவகம் vs. RAG
RAG தொடர்பான தொழில்நுட்பம்:
- **Modular RAG**: FlashRAG, ComposeRAG
- **Graph RAG**: LightRAG, HippoRAG
- **Agentic RAG**: PlanRAG, Self-RAG
RAG மற்றும் ஏஜென்ட் நினைவகம் இரண்டும் மாதிரி திறன்களை மேம்படுத்த வெளிப்புற சேமிப்பகத்திலிருந்து தகவல்களை மீட்டெடுப்பதை உள்ளடக்கியது, ஆனால் இரண்டுக்கும் வடிவமைப்பு தத்துவத்தில் ஒரு அடிப்படை வேறுபாடு உள்ளது:
| அம்சம் | RAG | ஏஜென்ட் நினைவகம் |
|---|---|---|
| முக்கிய குறிக்கோள் | தற்போதைய கேள்விக்கான தொடர்புடைய பின்னணி அறிவை வழங்குதல் | காலப்போக்கில் தொடர்ச்சியான கற்றல் மற்றும் தழுவல் நடத்தை |
| தகவல் ஆதாரம் | பொதுவாக நிலையான, முன் கட்டமைக்கப்பட்ட அறிவுத் தளம் | ஏஜென்ட்டின் சொந்த தொடர்பு அனுபவத்திலிருந்து மாறும் வகையில் உருவாக்கப்பட்ட தனிப்பயனாக்கப்பட்ட தகவல் |
| மீட்டெடுப்பு தூண்டுதல் | பயனர் வினவலால் செயலற்ற முறையில் தூண்டப்படுகிறது | ஏஜென்ட் எப்போது, எதை மீட்டெடுப்பது என்பதை தீவிரமாக தீர்மானிக்கிறது |
| தகவல் புதுப்பிப்பு | அறிவுத் தளம் பொதுவாக ஆஃப்லைனில் புதுப்பிக்கப்படுகிறது | ஆன்லைனில், தொடர்ந்து, தேர்ந்தெடுக்கப்பட்ட முறையில் புதுப்பிக்கப்படுகிறது |
| பின்னூட்ட சுழற்சி | நேரடி பின்னூட்ட வழிமுறை இல்லை | சுற்றுச்சூழல் தொடர்புகளுடன் மூடிய சுழற்சியை உருவாக்குகிறது |
**முக்கிய வேறுபாடு**: RAG என்பது ஒரு **அறிவு விரிவாக்க கருவி**, அதே நேரத்தில் ஏஜென்ட் நினைவகம் ஒரு **கற்றல் வழிமுறை**. RAG "எனக்கு என்ன தெரியும்" என்று பதிலளிக்கிறது, ஏஜென்ட் நினைவகம் "நான் என்ன கற்றுக்கொண்டேன்" என்று பதிலளிக்கிறது.
## ஏஜென்ட் நினைவகம் vs. LLM நினைவகம்
LLM நினைவகம் தொடர்பான தொழில்நுட்பம்:
- **Attention KV management**: Mixture-of-Memory
- **Long context processing**: Mamba, Memformer, MoA, Sparseformer, NSA
| பரிமாணம் | LLM நினைவகம் | ஏஜென்ட் நினைவகம் |
|---|---|---|
| வரையறை | மாதிரி அளவுருக்களில் உள்வாங்கப்பட்ட அறிவு அல்லது சூழல் சாளரத்தில் உள்ள தற்காலிக தகவல் | ஏஜென்ட் சுற்றுச்சூழலுடன் தொடர்ந்து தொடர்பு கொள்ளவும், பணி முழுவதும் கற்றுக்கொள்ளவும், நீண்ட காலத்திற்கு மாற்றியமைக்கவும் உதவும் வெளிப்புற அமைப்பு |
| நேர அளவு | முன் பயிற்சி தரவு அல்லது தற்போதைய உரையாடல் சூழலுக்கு மட்டுப்படுத்தப்பட்டது | பல பணிகள், அமர்வுகள் முழுவதும், வாழ்நாள் கற்றலை ஆதரிக்கிறது |
| புதுப்பிக்கக்கூடிய தன்மை | அளவுரு புதுப்பிப்பு அதிக செலவு கொண்டது, சூழல் தகவல் எளிதில் ஆவியாகும் | திறமையான, தேர்ந்தெடுக்கப்பட்ட மாறும் புதுப்பிப்புகள் மற்றும் பரிணாமத்தை ஆதரிக்கிறது |
| சுறுசுறுப்பு | வினவல்களுக்கு செயலற்ற பதில் | எந்த தகவலை சேமிப்பது, புதுப்பிப்பது, மீட்டெடுப்பது என்பதை தீவிரமாக தீர்மானிக்கிறது |
| சுற்றுச்சூழலுடன் இணைப்பு | சுற்றுச்சூழலுடன் நேரடி தொடர்பு இல்லை | ஆழமாக ஒருங்கிணைந்த சுற்றுச்சூழல் பின்னூட்டம், ஊடாடும் கற்றலை ஆதரிக்கிறது |
**முக்கிய வேறுபாடு**: LLM நினைவகம் அடிப்படையில் **நிலையானது** (அளவுருக்கள் சரி செய்யப்பட்டுள்ளன) அல்லது **குறுகிய காலமானது** (சூழல் வரையறுக்கப்பட்டுள்ளது), அதே நேரத்தில் ஏஜென்ட் நினைவகம் **மாறும், நிலையானது, சுற்றுச்சூழல் இணைக்கப்பட்டது**.
## ஏஜென்ட் நினைவகம் vs. சூழல் பொறியியல்
சூழல் பொறியியல் தொடர்பான தொழில்நுட்பம்:
- **Tool-integrated reasoning**: ReTool, ToolLLM, Toolformer, VTool-R1, ToRL
- **Tool selection**: AutoTool, VisTA
- **Communication protocol**: ANP, A2A, MCP, Agora
| அம்சம் | சூழல் பொறியியல் | ஏஜென்ட் நினைவகம் |
|---|---|---|
| கவனம் | ஒரு சுற்று அல்லது தற்போதைய பணியின் உள்ளீட்டு மேம்படுத்தல் | பல சுற்றுக்கள், பல பணிகள் முழுவதும் தகவல்களின் நிலைத்தன்மை மற்றும் பயன்பாடு |
| நேர பரிமாணம் | தற்போதைய அமர்வு | நீண்ட கால வரலாறு |
| தகவல் தேர்வு | மனிதனால் வடிவமைக்கப்பட்ட அல்லது启发式 விதிகள் | தானியங்கி உருவாக்கம், பரிணாமம், மீட்டெடுப்பு வழிமுறைகள் |
| நிலை மேலாண்மை | நிலையான நிலை இல்லை | வெளிப்படையாக பராமரிக்கப்படும் பரிணாம நினைவக நிலை |
**முக்கிய வேறுபாடு**: சூழல் பொறியியல் என்பது ஒரு **உதவிக்குறிப்பு மேம்படுத்தல் தொழில்நுட்பம்**, ஏஜென்ட் நினைவகம் ஒரு **நிலை மேலாண்மை அமைப்பு**. முந்தையது "இப்போது என்ன உள்ளீடு செய்வது" என்பதில் கவனம் செலுத்துகிறது, பிந்தையது "கடந்த காலத்தில் என்ன நினைவில் வைத்தேன், அது இப்போது மற்றும் எதிர்காலத்தை எவ்வாறு பாதிக்கிறது" என்பதில் கவனம் செலுத்துகிறது.
கடந்த இரண்டு ஆண்டுகளில், பெரிய மொழி மாதிரிகள் (LLM) AI ஏஜென்ட்களாக (AI Agents) வியக்கத்தக்க பரிணாமத்தை நாங்கள் கண்டோம். ஆழமான ஆராய்ச்சி முதல் மென்பொருள் பொறியியல் வரை, அறிவியல் கண்டுபிடிப்பு முதல் பல ஏஜென்ட் ஒத்துழைப்பு வரை, அடிப்படை மாதிரிகளை அடிப்படையாகக் கொண்ட இந்த ஏஜென்ட்கள் செயற்கை பொது நுண்ணறிவின் (AGI) எல்லைகளைத் தள்ளுகின்றன.
ஆனால் ஒரு முக்கிய கேள்வி எழுகிறது: **நிலையான LLM அளவுருக்களை விரைவாகப் புதுப்பிக்க முடியாது, ஏஜென்ட்களை எவ்வாறு தொடர்ச்சியான கற்றல் மற்றும் தழுவல் திறன்களைக் கொண்டிருக்கச் செய்வது?**
பதில் - **நினைவகம் (Memory)**.
> "நினைவகம் என்பது நிலையான LLM ஐ சுற்றுச்சூழலுடன் தொடர்பு கொண்டு தொடர்ந்து மாற்றியமைக்கக்கூடிய ஒரு ஏஜென்டாக மாற்றுவதற்கான முக்கிய திறனாகும்."
**Figure 1** கட்டுரையில் முன்மொழியப்பட்ட ஒருங்கிணைந்த வகைப்பாடு கட்டமைப்பைக் காட்டுகிறது, இது ஏஜென்ட் நினைவகத்தை **வடிவங்கள் (Forms)**, **செயல்பாடுகள் (Functions)**, **இயக்கவியல் (Dynamics)** ஆகிய மூன்று பரிமாணங்களின்படி ஒழுங்கமைக்கிறது மற்றும் பிரதிநிதித்துவ அமைப்புகளை இந்த வகைப்பாடு அமைப்பில் வரைபடமாக்குகிறது.
ஏஜென்ட் நினைவகம் மற்றும் நெருக்கமாக தொடர்புடைய ஆனால் அடிப்படையில் வேறுபட்ட கருத்துகளுக்கு இடையே உள்ள வேறுபாட்டை கட்டுரை தெளிவுபடுத்துகிறது: **LLM நினைவகம்**, **தேடல் மேம்படுத்தப்பட்ட உருவாக்கம் (RAG)** மற்றும் **சூழல் பொறியியல்**. அவை அனைத்தும் தகவல்களைச் சேமித்தல் மற்றும் பயன்படுத்துதல் ஆகியவற்றுடன் தொடர்புடையதாக இருந்தாலும், இலக்குகள், வழிமுறைகள் மற்றும் பயன்பாட்டு காட்சிகள் ஆகியவற்றில் முக்கியமான வேறுபாடுகள் உள்ளன.
## ஏஜென்ட் நினைவக தொழில்நுட்பம்
- **Self-Evolving Memory**: Memento, H2R
- **Multimodal Memory**: Ella, ViloMem, M3-Agent
- **Latent Memory**: MemoryLLM, M+, MemGen
- **Parametric Memory**: Retroformer, Early experience
- **RL-enabled Memory**: MemAgent, RMM, MemSearcher, MEM1, Mem-alpha, Memory-R1
## ஏஜென்ட் நினைவகம் vs. RAG
RAG தொடர்பான தொழில்நுட்பம்:
- **Modular RAG**: FlashRAG, ComposeRAG
- **Graph RAG**: LightRAG, HippoRAG
- **Agentic RAG**: PlanRAG, Self-RAG
RAG மற்றும் ஏஜென்ட் நினைவகம் இரண்டும் மாதிரி திறன்களை மேம்படுத்த வெளிப்புற சேமிப்பகத்திலிருந்து தகவல்களை மீட்டெடுப்பதை உள்ளடக்கியது, ஆனால் இரண்டுக்கும் வடிவமைப்பு தத்துவத்தில் ஒரு அடிப்படை வேறுபாடு உள்ளது:
| அம்சம் | RAG | ஏஜென்ட் நினைவகம் |
|---|---|---|
| முக்கிய குறிக்கோள் | தற்போதைய கேள்விக்கான தொடர்புடைய பின்னணி அறிவை வழங்குதல் | காலப்போக்கில் தொடர்ச்சியான கற்றல் மற்றும் தழுவல் நடத்தை |
| தகவல் ஆதாரம் | பொதுவாக நிலையான, முன் கட்டமைக்கப்பட்ட அறிவுத் தளம் | ஏஜென்ட்டின் சொந்த தொடர்பு அனுபவத்திலிருந்து மாறும் வகையில் உருவாக்கப்பட்ட தனிப்பயனாக்கப்பட்ட தகவல் |
| மீட்டெடுப்பு தூண்டுதல் | பயனர் வினவலால் செயலற்ற முறையில் தூண்டப்படுகிறது | ஏஜென்ட் எப்போது, எதை மீட்டெடுப்பது என்பதை தீவிரமாக தீர்மானிக்கிறது |
| தகவல் புதுப்பிப்பு | அறிவுத் தளம் பொதுவாக ஆஃப்லைனில் புதுப்பிக்கப்படுகிறது | ஆன்லைனில், தொடர்ந்து, தேர்ந்தெடுக்கப்பட்ட முறையில் புதுப்பிக்கப்படுகிறது |
| பின்னூட்ட சுழற்சி | நேரடி பின்னூட்ட வழிமுறை இல்லை | சுற்றுச்சூழல் தொடர்புகளுடன் மூடிய சுழற்சியை உருவாக்குகிறது |
**முக்கிய வேறுபாடு**: RAG என்பது ஒரு **அறிவு விரிவாக்க கருவி**, அதே நேரத்தில் ஏஜென்ட் நினைவகம் ஒரு **கற்றல் வழிமுறை**. RAG "எனக்கு என்ன தெரியும்" என்று பதிலளிக்கிறது, ஏஜென்ட் நினைவகம் "நான் என்ன கற்றுக்கொண்டேன்" என்று பதிலளிக்கிறது.
## ஏஜென்ட் நினைவகம் vs. LLM நினைவகம்
LLM நினைவகம் தொடர்பான தொழில்நுட்பம்:
- **Attention KV management**: Mixture-of-Memory
- **Long context processing**: Mamba, Memformer, MoA, Sparseformer, NSA
| பரிமாணம் | LLM நினைவகம் | ஏஜென்ட் நினைவகம் |
|---|---|---|
| வரையறை | மாதிரி அளவுருக்களில் உள்வாங்கப்பட்ட அறிவு அல்லது சூழல் சாளரத்தில் உள்ள தற்காலிக தகவல் | ஏஜென்ட் சுற்றுச்சூழலுடன் தொடர்ந்து தொடர்பு கொள்ளவும், பணி முழுவதும் கற்றுக்கொள்ளவும், நீண்ட காலத்திற்கு மாற்றியமைக்கவும் உதவும் வெளிப்புற அமைப்பு |
| நேர அளவு | முன் பயிற்சி தரவு அல்லது தற்போதைய உரையாடல் சூழலுக்கு மட்டுப்படுத்தப்பட்டது | பல பணிகள், அமர்வுகள் முழுவதும், வாழ்நாள் கற்றலை ஆதரிக்கிறது |
| புதுப்பிக்கக்கூடிய தன்மை | அளவுரு புதுப்பிப்பு அதிக செலவு கொண்டது, சூழல் தகவல் எளிதில் ஆவியாகும் | திறமையான, தேர்ந்தெடுக்கப்பட்ட மாறும் புதுப்பிப்புகள் மற்றும் பரிணாமத்தை ஆதரிக்கிறது |
| சுறுசுறுப்பு | வினவல்களுக்கு செயலற்ற பதில் | எந்த தகவலை சேமிப்பது, புதுப்பிப்பது, மீட்டெடுப்பது என்பதை தீவிரமாக தீர்மானிக்கிறது |
| சுற்றுச்சூழலுடன் இணைப்பு | சுற்றுச்சூழலுடன் நேரடி தொடர்பு இல்லை | ஆழமாக ஒருங்கிணைந்த சுற்றுச்சூழல் பின்னூட்டம், ஊடாடும் கற்றலை ஆதரிக்கிறது |
**முக்கிய வேறுபாடு**: LLM நினைவகம் அடிப்படையில் **நிலையானது** (அளவுருக்கள் சரி செய்யப்பட்டுள்ளன) அல்லது **குறுகிய காலமானது** (சூழல் வரையறுக்கப்பட்டுள்ளது), அதே நேரத்தில் ஏஜென்ட் நினைவகம் **மாறும், நிலையானது, சுற்றுச்சூழல் இணைக்கப்பட்டது**.
## ஏஜென்ட் நினைவகம் vs. சூழல் பொறியியல்
சூழல் பொறியியல் தொடர்பான தொழில்நுட்பம்:
- **Tool-integrated reasoning**: ReTool, ToolLLM, Toolformer, VTool-R1, ToRL
- **Tool selection**: AutoTool, VisTA
- **Communication protocol**: ANP, A2A, MCP, Agora
| அம்சம் | சூழல் பொறியியல் | ஏஜென்ட் நினைவகம் |
|---|---|---|
| கவனம் | ஒரு சுற்று அல்லது தற்போதைய பணியின் உள்ளீட்டு மேம்படுத்தல் | பல சுற்றுக்கள், பல பணிகள் முழுவதும் தகவல்களின் நிலைத்தன்மை மற்றும் பயன்பாடு |
| நேர பரிமாணம் | தற்போதைய அமர்வு | நீண்ட கால வரலாறு |
| தகவல் தேர்வு | மனிதனால் வடிவமைக்கப்பட்ட அல்லது启发式 விதிகள் | தானியங்கி உருவாக்கம், பரிணாமம், மீட்டெடுப்பு வழிமுறைகள் |
| நிலை மேலாண்மை | நிலையான நிலை இல்லை | வெளிப்படையாக பராமரிக்கப்படும் பரிணாம நினைவக நிலை |
**முக்கிய வேறுபாடு**: சூழல் பொறியியல் என்பது ஒரு **உதவிக்குறிப்பு மேம்படுத்தல் தொழில்நுட்பம்**, ஏஜென்ட் நினைவகம் ஒரு **நிலை மேலாண்மை அமைப்பு**. முந்தையது "இப்போது என்ன உள்ளீடு செய்வது" என்பதில் கவனம் செலுத்துகிறது, பிந்தையது "கடந்த காலத்தில் என்ன நினைவில் வைத்தேன், அது இப்போது மற்றும் எதிர்காலத்தை எவ்வாறு பாதிக்கிறது" என்பதில் கவனம் செலுத்துகிறது.Published in Technology





