107 பக்க RAG மற்றும் Agent&LLM நினைவகத்தின் ஆய்வு

2/15/2026
4 min read
இன்று, ரென்மின் பல்கலைக்கழகம், ஃபுடான் பல்கலைக்கழகம், பெக்கிங் பல்கலைக்கழகம் போன்றவற்றின் 107 பக்க தொழில்நுட்ப ஆய்வான "AI ஏஜென்ட்களின் காலத்தில் நினைவகம்: ஒரு ஆய்வு வடிவங்கள், செயல்பாடுகள் மற்றும் இயக்கவியல்" என்பதைப் பகிர்கிறேன். திட்ட முகவரி: https://github.com/Shichun-Liu/Agent-Memory-Paper-List கட்டுரை முகவரி: https://arxiv.org/pdf/2512.13564 கடந்த இரண்டு ஆண்டுகளில், பெரிய மொழி மாதிரிகள் (LLM) AI ஏஜென்ட்களாக (AI Agents) வியக்கத்தக்க பரிணாமத்தை நாங்கள் கண்டோம். ஆழமான ஆராய்ச்சி முதல் மென்பொருள் பொறியியல் வரை, அறிவியல் கண்டுபிடிப்பு முதல் பல ஏஜென்ட் ஒத்துழைப்பு வரை, அடிப்படை மாதிரிகளை அடிப்படையாகக் கொண்ட இந்த ஏஜென்ட்கள் செயற்கை பொது நுண்ணறிவின் (AGI) எல்லைகளைத் தள்ளுகின்றன. ஆனால் ஒரு முக்கிய கேள்வி எழுகிறது: **நிலையான LLM அளவுருக்களை விரைவாகப் புதுப்பிக்க முடியாது, ஏஜென்ட்களை எவ்வாறு தொடர்ச்சியான கற்றல் மற்றும் தழுவல் திறன்களைக் கொண்டிருக்கச் செய்வது?** பதில் - **நினைவகம் (Memory)**. > "நினைவகம் என்பது நிலையான LLM ஐ சுற்றுச்சூழலுடன் தொடர்பு கொண்டு தொடர்ந்து மாற்றியமைக்கக்கூடிய ஒரு ஏஜென்டாக மாற்றுவதற்கான முக்கிய திறனாகும்." **Figure 1** கட்டுரையில் முன்மொழியப்பட்ட ஒருங்கிணைந்த வகைப்பாடு கட்டமைப்பைக் காட்டுகிறது, இது ஏஜென்ட் நினைவகத்தை **வடிவங்கள் (Forms)**, **செயல்பாடுகள் (Functions)**, **இயக்கவியல் (Dynamics)** ஆகிய மூன்று பரிமாணங்களின்படி ஒழுங்கமைக்கிறது மற்றும் பிரதிநிதித்துவ அமைப்புகளை இந்த வகைப்பாடு அமைப்பில் வரைபடமாக்குகிறது. ஏஜென்ட் நினைவகம் மற்றும் நெருக்கமாக தொடர்புடைய ஆனால் அடிப்படையில் வேறுபட்ட கருத்துகளுக்கு இடையே உள்ள வேறுபாட்டை கட்டுரை தெளிவுபடுத்துகிறது: **LLM நினைவகம்**, **தேடல் மேம்படுத்தப்பட்ட உருவாக்கம் (RAG)** மற்றும் **சூழல் பொறியியல்**. அவை அனைத்தும் தகவல்களைச் சேமித்தல் மற்றும் பயன்படுத்துதல் ஆகியவற்றுடன் தொடர்புடையதாக இருந்தாலும், இலக்குகள், வழிமுறைகள் மற்றும் பயன்பாட்டு காட்சிகள் ஆகியவற்றில் முக்கியமான வேறுபாடுகள் உள்ளன. ## ஏஜென்ட் நினைவக தொழில்நுட்பம் - **Self-Evolving Memory**: Memento, H2R - **Multimodal Memory**: Ella, ViloMem, M3-Agent - **Latent Memory**: MemoryLLM, M+, MemGen - **Parametric Memory**: Retroformer, Early experience - **RL-enabled Memory**: MemAgent, RMM, MemSearcher, MEM1, Mem-alpha, Memory-R1 ## ஏஜென்ட் நினைவகம் vs. RAG RAG தொடர்பான தொழில்நுட்பம்: - **Modular RAG**: FlashRAG, ComposeRAG - **Graph RAG**: LightRAG, HippoRAG - **Agentic RAG**: PlanRAG, Self-RAG RAG மற்றும் ஏஜென்ட் நினைவகம் இரண்டும் மாதிரி திறன்களை மேம்படுத்த வெளிப்புற சேமிப்பகத்திலிருந்து தகவல்களை மீட்டெடுப்பதை உள்ளடக்கியது, ஆனால் இரண்டுக்கும் வடிவமைப்பு தத்துவத்தில் ஒரு அடிப்படை வேறுபாடு உள்ளது: | அம்சம் | RAG | ஏஜென்ட் நினைவகம் | |---|---|---| | முக்கிய குறிக்கோள் | தற்போதைய கேள்விக்கான தொடர்புடைய பின்னணி அறிவை வழங்குதல் | காலப்போக்கில் தொடர்ச்சியான கற்றல் மற்றும் தழுவல் நடத்தை | | தகவல் ஆதாரம் | பொதுவாக நிலையான, முன் கட்டமைக்கப்பட்ட அறிவுத் தளம் | ஏஜென்ட்டின் சொந்த தொடர்பு அனுபவத்திலிருந்து மாறும் வகையில் உருவாக்கப்பட்ட தனிப்பயனாக்கப்பட்ட தகவல் | | மீட்டெடுப்பு தூண்டுதல் | பயனர் வினவலால் செயலற்ற முறையில் தூண்டப்படுகிறது | ஏஜென்ட் எப்போது, ​​எதை மீட்டெடுப்பது என்பதை தீவிரமாக தீர்மானிக்கிறது | | தகவல் புதுப்பிப்பு | அறிவுத் தளம் பொதுவாக ஆஃப்லைனில் புதுப்பிக்கப்படுகிறது | ஆன்லைனில், தொடர்ந்து, தேர்ந்தெடுக்கப்பட்ட முறையில் புதுப்பிக்கப்படுகிறது | | பின்னூட்ட சுழற்சி | நேரடி பின்னூட்ட வழிமுறை இல்லை | சுற்றுச்சூழல் தொடர்புகளுடன் மூடிய சுழற்சியை உருவாக்குகிறது | **முக்கிய வேறுபாடு**: RAG என்பது ஒரு **அறிவு விரிவாக்க கருவி**, அதே நேரத்தில் ஏஜென்ட் நினைவகம் ஒரு **கற்றல் வழிமுறை**. RAG "எனக்கு என்ன தெரியும்" என்று பதிலளிக்கிறது, ஏஜென்ட் நினைவகம் "நான் என்ன கற்றுக்கொண்டேன்" என்று பதிலளிக்கிறது. ## ஏஜென்ட் நினைவகம் vs. LLM நினைவகம் LLM நினைவகம் தொடர்பான தொழில்நுட்பம்: - **Attention KV management**: Mixture-of-Memory - **Long context processing**: Mamba, Memformer, MoA, Sparseformer, NSA | பரிமாணம் | LLM நினைவகம் | ஏஜென்ட் நினைவகம் | |---|---|---| | வரையறை | மாதிரி அளவுருக்களில் உள்வாங்கப்பட்ட அறிவு அல்லது சூழல் சாளரத்தில் உள்ள தற்காலிக தகவல் | ஏஜென்ட் சுற்றுச்சூழலுடன் தொடர்ந்து தொடர்பு கொள்ளவும், பணி முழுவதும் கற்றுக்கொள்ளவும், நீண்ட காலத்திற்கு மாற்றியமைக்கவும் உதவும் வெளிப்புற அமைப்பு | | நேர அளவு | முன் பயிற்சி தரவு அல்லது தற்போதைய உரையாடல் சூழலுக்கு மட்டுப்படுத்தப்பட்டது | பல பணிகள், அமர்வுகள் முழுவதும், வாழ்நாள் கற்றலை ஆதரிக்கிறது | | புதுப்பிக்கக்கூடிய தன்மை | அளவுரு புதுப்பிப்பு அதிக செலவு கொண்டது, சூழல் தகவல் எளிதில் ஆவியாகும் | திறமையான, தேர்ந்தெடுக்கப்பட்ட மாறும் புதுப்பிப்புகள் மற்றும் பரிணாமத்தை ஆதரிக்கிறது | | சுறுசுறுப்பு | வினவல்களுக்கு செயலற்ற பதில் | எந்த தகவலை சேமிப்பது, புதுப்பிப்பது, மீட்டெடுப்பது என்பதை தீவிரமாக தீர்மானிக்கிறது | | சுற்றுச்சூழலுடன் இணைப்பு | சுற்றுச்சூழலுடன் நேரடி தொடர்பு இல்லை | ஆழமாக ஒருங்கிணைந்த சுற்றுச்சூழல் பின்னூட்டம், ஊடாடும் கற்றலை ஆதரிக்கிறது | **முக்கிய வேறுபாடு**: LLM நினைவகம் அடிப்படையில் **நிலையானது** (அளவுருக்கள் சரி செய்யப்பட்டுள்ளன) அல்லது **குறுகிய காலமானது** (சூழல் வரையறுக்கப்பட்டுள்ளது), அதே நேரத்தில் ஏஜென்ட் நினைவகம் **மாறும், நிலையானது, சுற்றுச்சூழல் இணைக்கப்பட்டது**. ## ஏஜென்ட் நினைவகம் vs. சூழல் பொறியியல் சூழல் பொறியியல் தொடர்பான தொழில்நுட்பம்: - **Tool-integrated reasoning**: ReTool, ToolLLM, Toolformer, VTool-R1, ToRL - **Tool selection**: AutoTool, VisTA - **Communication protocol**: ANP, A2A, MCP, Agora | அம்சம் | சூழல் பொறியியல் | ஏஜென்ட் நினைவகம் | |---|---|---| | கவனம் | ஒரு சுற்று அல்லது தற்போதைய பணியின் உள்ளீட்டு மேம்படுத்தல் | பல சுற்றுக்கள், பல பணிகள் முழுவதும் தகவல்களின் நிலைத்தன்மை மற்றும் பயன்பாடு | | நேர பரிமாணம் | தற்போதைய அமர்வு | நீண்ட கால வரலாறு | | தகவல் தேர்வு | மனிதனால் வடிவமைக்கப்பட்ட அல்லது启发式 விதிகள் | தானியங்கி உருவாக்கம், பரிணாமம், மீட்டெடுப்பு வழிமுறைகள் | | நிலை மேலாண்மை | நிலையான நிலை இல்லை | வெளிப்படையாக பராமரிக்கப்படும் பரிணாம நினைவக நிலை | **முக்கிய வேறுபாடு**: சூழல் பொறியியல் என்பது ஒரு **உதவிக்குறிப்பு மேம்படுத்தல் தொழில்நுட்பம்**, ஏஜென்ட் நினைவகம் ஒரு **நிலை மேலாண்மை அமைப்பு**. முந்தையது "இப்போது என்ன உள்ளீடு செய்வது" என்பதில் கவனம் செலுத்துகிறது, பிந்தையது "கடந்த காலத்தில் என்ன நினைவில் வைத்தேன், அது இப்போது மற்றும் எதிர்காலத்தை எவ்வாறு பாதிக்கிறது" என்பதில் கவனம் செலுத்துகிறது.
Published in Technology

You Might Also Like

📝
Technology

Claude Code Buddy மாற்றம் வழிகாட்டி: எவ்வாறு மின்ன闪传说 நிலை செல்லப்பிராணிகளை பெறுவது

Claude Code Buddy மாற்றம் வழிகாட்டி: எவ்வாறு மின்ன闪传说 நிலை செல்லப்பிராணிகளை பெறுவது 2026年4月1日,Anthropic 在 Claude Code 2....

Obsidian வெளியிட்ட Defuddle, Obsidian Web Clipper-ஐ புதிய உயரத்திற்கு கொண்டு சென்றதுTechnology

Obsidian வெளியிட்ட Defuddle, Obsidian Web Clipper-ஐ புதிய உயரத்திற்கு கொண்டு சென்றது

Obsidian வெளியிட்ட Defuddle, Obsidian Web Clipper-ஐ புதிய உயரத்திற்கு கொண்டு சென்றது நான் எப்போதும் Obsidian-இன் மையக் ...

OpenAI திடீரென "மூன்று-in-ஒன்று" அறிவிப்பு: உலாவி + நிரலாக்கம் + ChatGPT இணைப்பு, கடந்த ஆண்டு தவறான பாதையில் சென்றது என உள்ளூரில் ஒப்புதல்Technology

OpenAI திடீரென "மூன்று-in-ஒன்று" அறிவிப்பு: உலாவி + நிரலாக்கம் + ChatGPT இணைப்பு, கடந்த ஆண்டு தவறான பாதையில் சென்றது என உள்ளூரில் ஒப்புதல்

OpenAI திடீரென "மூன்று-in-ஒன்று" அறிவிப்பு: உலாவி + நிரலாக்கம் + ChatGPT இணைப்பு, கடந்த ஆண்டு தவறான பாதையில் சென்றது என ...

2026, உங்களை 'சுய கட்டுப்பாடு' செய்ய அழைக்காதீர்கள்! இந்த 8 சிறிய விஷயங்களைச் செய்யுங்கள், ஆரோக்கியம் தானாகவே வரும்Health

2026, உங்களை 'சுய கட்டுப்பாடு' செய்ய அழைக்காதீர்கள்! இந்த 8 சிறிய விஷயங்களைச் செய்யுங்கள், ஆரோக்கியம் தானாகவே வரும்

2026, உங்களை 'சுய கட்டுப்பாடு' செய்ய அழைக்காதீர்கள்! இந்த 8 சிறிய விஷயங்களைச் செய்யுங்கள், ஆரோக்கியம் தானாகவே வரும் புத...

அந்த முயற்சியுடன் எடை குறைக்க முயற்சிக்கும் அம்மாக்கள், இங்கே தவறுகிறார்கள்Health

அந்த முயற்சியுடன் எடை குறைக்க முயற்சிக்கும் அம்மாக்கள், இங்கே தவறுகிறார்கள்

அந்த முயற்சியுடன் எடை குறைக்க முயற்சிக்கும் அம்மாக்கள், இங்கே தவறுகிறார்கள் மார்ச் மாதம் மிதமான நிலையில் உள்ளது, உங்கள்...

📝
Technology

AI Browser 24 மணி நேர நிலையான இயக்கம் வழிகாட்டி

AI Browser 24 மணி நேர நிலையான இயக்கம் வழிகாட்டி இந்த பயிற்சி நிலையான, நீண்ட காலம் இயங்கும் AI உலாவி சூழலை அமைக்க எப்படி ...