సమీపంలో, LLM+KGతో సంక్లిష్ట తార్కిక అనుమితిపై 2 మంచి పరిశోధనా పత్రాలను చూశాను
సమీపంలో, LLM+KGతో సంక్లిష్ట తార్కిక అనుమితిపై 2 మంచి పరిశోధనా పత్రాలను చూశాను
-
LARK https://arxiv.org/abs/2305.01157 Complex Logical Reasoning over Knowledge Graphs using Large Language Models
-
ROG https://arxiv.org/abs/2512.19092 A Large Language Model Based Method for Complex Logical Reasoning over Knowledge Graphs
I. జ్ఞాన గ్రాఫ్ అనుమితి యొక్క ఇబ్బందులు
జ్ఞాన గ్రాఫ్ (KG) నిర్మాణాత్మక జ్ఞానం యొక్క ప్రధాన వాహకంగా, మూడు ప్రధాన సమస్యలను ఎదుర్కొంటోంది:
- సంక్లిష్టత: బహుళ-హాప్ అనుమితి, కూడలి మరియు సమితి, ప్రతికూలత వంటి కార్యకలాపాల కలయిక పేలుడు
- అసంపూర్ణత: నిజమైన ప్రపంచ KG సాధారణంగా శబ్దం మరియు లోపాలను కలిగి ఉంటుంది
- సాధారణీకరణ: సాంప్రదాయ ఎంబెడ్డింగ్ పద్ధతులు డేటాసెట్ల మధ్య బదిలీ చేయడం కష్టం
సాంప్రదాయ పరిష్కారాలు (Query2Box, BetaE వంటివి) రేఖాగణిత ఎంబెడ్డింగ్ స్థలంపై ఆధారపడతాయి, తార్కిక కార్యకలాపాలను వెక్టర్/బాక్స్ కార్యకలాపాలుగా మోడల్ చేస్తాయి, అయితే లోతైన అనుమితిలో సమాచార నష్టం తీవ్రంగా ఉంటుంది. నమూనా తార్కిక నిర్మాణాన్ని అర్థం చేసుకునేలా మరియు అనువైన అనుమితిని ఎలా చేయాలి? పెద్ద భాషా నమూనాలు (LLM) కొత్త ఆలోచనలను అందించాయి.
చిత్రం 1: LARK యొక్క ప్రశ్న గొలుసు విచ్ఛిన్నం మరియు LLM అనుమితి ప్రక్రియ. సంక్లిష్టమైన బహుళ-ఆపరేషన్ ప్రశ్నలను ఒకే-ఆపరేషన్ ఉప ప్రశ్నలుగా విభజించి, క్రమంగా పరిష్కరించండి.
II. పరిష్కారం: రెండు తరాల పద్ధతుల వారసత్వం మరియు పరిణామం
LARK (2023) —— ప్రారంభ రచన
చిత్రం 2: 14 రకాల ప్రశ్నల విచ్ఛిన్న వ్యూహాలు. 3pని 3 ప్రొజెక్షన్లుగా విభజించారు మరియు 3iని 3 ప్రొజెక్షన్లు + 1 కూడలిగా విభజించారు.
ప్రధాన ఆవిష్కరణ: ప్రశ్న సంగ్రహణ + తార్కిక గొలుసు విచ్ఛిన్నం
భాగం రూపకల్పన ప్రశ్న సంగ్రహణ ఎంటిటీ/సంబంధాన్ని IDతో భర్తీ చేయండి, భ్రమలను తొలగించండి, సాధారణీకరణను మెరుగుపరచండి పరిసర ప్రాంతం తిరిగి పొందడం k-హాప్ డెప్త్-ఫస్ట్ ట్రావెర్సల్ (k=3), సంబంధిత సబ్గ్రాఫ్ను సంగ్రహించండి గొలుసు విచ్ఛిన్నం బహుళ-ఆపరేషన్ ప్రశ్న → ఒకే-ఆపరేషన్ ఉప ప్రశ్న శ్రేణి క్రమ అనుమితి మధ్యంతర ఫలితాలను కాష్ చేయండి, తార్కికంగా క్రమబద్ధమైన ప్లేస్హోల్డర్లను భర్తీ చేయండి కీలక అంతర్దృష్టి: LLM సాధారణ ప్రశ్నలలో మంచిది, సంక్లిష్ట ప్రశ్నలను విడదీసిన తర్వాత పనితీరు 20%-33% మెరుగుపడుతుంది.
ROG (2025) —— అధునాతన సంస్కరణ
LARK ఫ్రేమ్వర్క్ను వారసత్వంగా పొందింది, ఏజెంట్ ఏకాభిప్రాయ విధానాన్ని జోడించింది:
ROG = LARK కోర్ + బహుళ-ఏజెంట్ సహకారం + ఆలోచనా గొలుసు బలోపేతం
మెరుగుదల వివరణ ఏజెంట్ రూపకల్పన తెలివైన శరీరం = జ్ఞాన స్థావరం + LLM, బహుళ-ఏజెంట్ ఏకాభిప్రాయ నిర్ణయం CoT మెరుగైన మరింత స్పష్టమైన ఆలోచనా గొలుసు ప్రాంప్ట్ టెంప్లేట్ దేశీయ అనుకూలత ChatGLM+Neo4j ఆధారంగా, విద్యుత్ శక్తి వంటి నిలువు రంగాల కోసం
ROG యొక్క డేటా ప్రవాహ నమూనా
పనితీరు పెరుగుదల: FB15kలో, ip ప్రశ్న (కూడలి తర్వాత ప్రొజెక్షన్) MRR 29.3→62.0 నుండి 111% పెరిగింది!
పట్టిక 1: FB15k డేటాసెట్ MRR పోలిక. ROG సమగ్రంగా ముందంజలో ఉంది మరియు మిశ్రమ ప్రశ్న మెరుగుదల అత్యంత ముఖ్యమైనది.
III. నమూనా స్థాపన మరియు భవిష్యత్తు దిశ
రెండు తరాల పరిశోధనా పత్రాలు ఒక నమూనాను ఉమ్మడిగా ధృవీకరించాయి:
"తిరిగి పొందడం మెరుగుదల + ప్రశ్న విచ్ఛిన్నం + LLM అనుమితి" అనేది KG సంక్లిష్ట తార్కిక అనుమితికి సమర్థవంతమైన మార్గం.
ముఖ్యమైన పోకడలు:
- సంగ్రహణ చాలా ముఖ్యమైనది —— శబ్ద శబ్దాన్ని తొలగించండి, తార్కిక నిర్మాణంపై దృష్టి పెట్టండి
- విచ్ఛిన్న వ్యూహం పరిమితిని నిర్ణయిస్తుంది —— గొలుసు విచ్ఛిన్నం ఎండ్-టు-ఎండ్ కంటే నమ్మదగినది
- నమూనా సామర్థ్యం నిరంతరం విడుదల అవుతోంది —— Llama2-7B నుండి ChatGLM వరకు, బేస్ పురోగతి గణనీయమైన లాభాలను తెస్తుంది
ROG యొక్క ఏజెంట్ విధానం వివరణాత్మకతను మెరుగుపరిచినప్పటికీ, ప్రధాన ఆవిష్కరణ సైద్ధాంతిక పురోగతి కంటే ఇంజనీరింగ్ ఆప్టిమైజేషన్లో ఉంది. భవిష్యత్తు దిశలో డైనమిక్ విచ్ఛిన్న వ్యూహాలు (స్వీయ-అనుకూల ప్రశ్న సంక్లిష్టత), బహుళ-మాడల్ KG విలీనం మరియు పెద్ద ఎత్తున ఓపెన్-డొమైన్ ధ్రువీకరణ ఉండవచ్చు.

