Саяхан LLM+KG-ийн тусламжтайгаар нарийн төвөгтэй логик дүгнэлт хийх талаарх 2 сайн өгүүллийг харлаа
Саяхан LLM+KG-ийн тусламжтайгаар нарийн төвөгтэй логик дүгнэлт хийх талаарх 2 сайн өгүүллийг харлаа
-
LARK https://arxiv.org/abs/2305.01157 Complex Logical Reasoning over Knowledge Graphs using Large Language Models
-
ROG https://arxiv.org/abs/2512.19092 A Large Language Model Based Method for Complex Logical Reasoning over Knowledge Graphs
I. Мэдлэгийн график дүгнэлтийн бэрхшээл
Мэдлэгийн график (KG) нь бүтэцтэй мэдлэгийн гол тээвэрлэгчийн хувьд гурван гол асуудалтай тулгардаг:
- Нарийн төвөгтэй байдал: Олон үсрэлттэй дүгнэлт, огтлолцол ба нэгдлийн багц, үгүйсгэх гэх мэт үйлдлүүдийн хослол тэсрэлт
- Бүрэн бус байдал: Бодит ертөнцийн KG нь ихэвчлэн дуу чимээ, алдаатай байдаг
- Ерөнхий байдал: Уламжлалт суулгах аргууд нь өгөгдлийн багцыг дамжуулахад хэцүү байдаг
Уламжлалт шийдлүүд (жишээлбэл, Query2Box, BetaE) нь геометрийн суулгах орон зайд тулгуурлан логик үйлдлүүдийг вектор/хайрцаг үйлдлээр загварчилдаг боловч гүнзгий дүгнэлт хийх үед мэдээлэл ихээхэн алдагддаг. Загвар нь логик бүтцийг хэрхэн ойлгож, уян хатан дүгнэлт хийх вэ? Том хэлний загвар (LLM)-ын өсөлт нь шинэ санааг өгсөн.
Зураг 1: LARK-ийн асуулгын гинжин хэлхээний задрал ба LLM дүгнэлтийн урсгал. Олон үйлдлийн нарийн төвөгтэй асуулгыг нэг үйлдлийн дэд асуулгад хувааж, аажмаар шийдвэрлэнэ.
II. Шийдэл: Хоёр үеийн аргын өв уламжлал ба хувьсал
LARK (2023) —— Нээлтийн ажил
Зураг 2: 14 төрлийн асуулгын задралын стратеги. 3p нь 3 төсөөлөл болж задардаг, 3i нь 3 төсөөлөл + 1 огтлолцол болж задардаг.
Гол шинэчлэл: Асуулгын хийсвэрлэл + Логик гинжин хэлхээний задрал
Бүрэлдэхүүн хэсгийн загварчлал Асуулгын хийсвэрлэл Объект/харилцааг ID-аар сольж, хийсвэрлэлтийг арилгаж, ерөнхий байдлыг сайжруулна Хөршийн хайлт k-hop гүнзгийрүүлсэн хайлт (k=3), холбогдох дэд графикийг гаргаж авна Гинжин хэлхээний задрал Олон үйлдлийн асуулга → Нэг үйлдлийн дэд асуулгын дараалал Дараалсан дүгнэлт Завсрын үр дүнг кэшлэх, логикийн дарааллаар эзэмшигчийг солих Гол ойлголт: LLM нь энгийн асуулгад сайн, нарийн төвөгтэй асуулгыг задалсны дараа гүйцэтгэл 20%-33%-иар сайжирна.
ROG (2025) —— Дэвшилтэт хувилбар
LARK-ийн хүрээг өвлөн авч, Agent-ийн зөвшилцлийн механизмыг нэмсэн:
ROG = LARK цөм + Олон Agent-ийн хамтын ажиллагаа + Сэтгэлгээний гинжин хэлхээг сайжруулах
Сайжруулсан зүйлсийн тайлбар
Agent-ийн загварчлал
Ухаалаг биет = Мэдлэгийн сан + LLM, Олон Agent-ийн зөвшилцлийн шийдвэр
CoT-ийг сайжруулах
Илүү тодорхой сэтгэлгээний гинжин хэлхээний санамж
Дотоодын дасан зохицох
ChatGLM+Neo4j дээр суурилсан, цахилгаан гэх мэт босоо салбарт чиглэсэн
ROG-ийн өгөгдлийн урсгалын загвар
Гүйцэтгэлийн үсрэлт: FB15k дээр ip асуулгын (огтлолцлын дараах төсөөлөл) MRR нь 29.3→62.0 болж, 111%-иар сайжирсан!
Хүснэгт 1: FB15k өгөгдлийн багцын MRR харьцуулалт. ROG бүх талаараа тэргүүлж, нийлмэл асуулгын сайжруулалт хамгийн мэдэгдэхүйц байна.
III. Загвар тогтоох ба ирээдүйн чиглэл
Хоёр үеийн өгүүлэл нь нэг загварыг баталгаажуулсан:
"Хайлт сайжруулах + Асуулга задлах + LLM дүгнэлт" нь KG-ийн нарийн төвөгтэй логик дүгнэлтийн үр дүнтэй арга зам юм.
Гол чиг хандлага:
- Хийсвэрлэл маш чухал —— Семантик дуу чимээг арилгаж, логик бүтэцэд анхаарлаа хандуулах
- Задралын стратеги нь дээд хязгаарыг тодорхойлдог —— Гинжин хэлхээний задрал нь төгсгөлөөс төгсгөл хүртэлхээс илүү найдвартай
- Загварын чадвар үргэлжлэн нэмэгдэж байна —— Llama2-7B-ээс ChatGLM хүртэл суурь сайжруулалт нь мэдэгдэхүйц ашиг авчирдаг
ROG-ийн Agent механизм нь тайлбарлах чадварыг сайжруулдаг боловч гол шинэчлэл нь онолын дэвшил биш харин инженерийн оновчлол юм. Ирээдүйн чиглэл нь динамик задралын стратеги (асуулгын нарийн төвөгтэй байдалд дасан зохицох), олон горимт KG нэгдэл, мөн илүү том хэмжээний нээлттэй домэйны баталгаажуулалт байж болно.





