최근, LLM+KG를 이용한 복잡한 논리 추론에 관한 훌륭한 논문 2편을 보았습니다.

LARK https://arxiv.org/abs/2305.01157 Complex Logical Reasoning over Knowledge Graphs using Large Language Models
ROG https://arxiv.org/abs/2512.19092 A Large Language Model Based Method for Complex Logical Reasoning over Knowledge Graphs

1. 지식 그래프 추론의 어려움

지식 그래프(KG)는 구조화된 지식의 핵심적인 매개체로서, 다음과 같은 세 가지 주요 문제점에 직면해 있습니다.

복잡성: 다중 홉 추론, 교집합 및 합집합, 부정 등의 연산 조합 폭발
불완전성: 실제 세계의 KG에는 일반적으로 노이즈와 결손이 존재함
일반화 가능성: 기존의 임베딩 방법으로는 데이터 세트 간의 마이그레이션이 어려움

기존의 솔루션(예: Query2Box, BetaE)은 기하 임베딩 공간에 의존하여 논리 연산을 벡터/박스 연산으로 모델링하지만, 심층 추론 시 정보 손실이 심각합니다. 모델이 논리 구조를 이해하면서도 유연하게 추론할 수 있도록 하려면 어떻게 해야 할까요? 대규모 언어 모델(LLM)의 부상은 새로운 아이디어를 제공합니다.

그림 1: LARK의 쿼리 체인 분해 및 LLM 추론 프로세스. 복잡한 다중 연산 쿼리를 단일 연산 하위 쿼리로 분해하여 점진적으로 해결합니다.

2. 솔루션: 두 세대 방법의 계승과 진화

LARK (2023) —— 선구적인 작품

그림 2: 14가지 쿼리 유형의 분해 전략. 3p는 3개의 투영으로 분해하고, 3i는 3개의 투영 + 1개의 교집합으로 분해합니다.

핵심 혁신: 쿼리 추상화 + 논리 체인 분해

컴포넌트 설계 쿼리 추상화 엔터티/관계 ID로 대체, 환각 제거, 일반화 개선 인접 영역 검색 k-hop 깊이 우선 탐색(k=3), 관련 하위 그래프 추출 체인 분해 다중 연산 쿼리 → 단일 연산 하위 쿼리 시퀀스 순차적 추론 중간 결과 캐싱, 논리적 순서로 자리 표시자 대체 핵심 통찰력: LLM은 간단한 쿼리에 능숙하며, 복잡한 쿼리를 분해하면 성능이 20%-33% 향상됩니다.