체인 오브 노리지: 지식 그래프 학습을 통해 대규모 언어 모델에 지식 추론 통합하기
Chain-of-Knowledge: Integrating Knowledge Reasoning into Large Language Models by Learning from Knowledge Graphs
June 30, 2024
저자: Yifei Zhang, Xintao Wang, Jiaqing Liang, Sirui Xia, Lida Chen, Yanghua Xiao
cs.AI
초록
대규모 언어 모델(LLMs)은 점점 더 복잡해지는 추론을 포함한 다양한 자연어 처리(NLP) 작업에서 인상적인 숙련도를 보여주고 있습니다. 지식 추론은 주요 추론 유형 중 하나로, 기존 지식에서 새로운 지식을 도출하는 것을 목표로 합니다. 지식 그래프(KGs)를 중심으로 널리 연구되어 왔지만, LLMs에서의 지식 추론은 아직 충분히 탐구되지 않았습니다. 본 논문에서는 데이터셋 구축과 모델 학습을 모두 포함한 포괄적인 지식 추론 프레임워크인 Chain-of-Knowledge(CoK)를 소개합니다. 데이터셋 구축을 위해, 우리는 KGs에 대한 규칙 마이닝을 통해 KnowReason을 생성합니다. 모델 학습에서는 단순한 학습으로 인한 규칙 과적합 문제를 관찰했습니다. 따라서, 우리는 인간의 내부 지식 탐색 과정을 시뮬레이션하는 시행착오 메커니즘을 CoK에 도입하여 개선했습니다. KnowReason을 사용한 광범위한 실험을 수행한 결과, CoK가 지식 추론뿐만 아니라 일반적인 추론 벤치마크에서도 LLMs을 개선하는 데 효과적임을 보여주었습니다.
English
Large Language Models (LLMs) have exhibited impressive proficiency in various
natural language processing (NLP) tasks, which involve increasingly complex
reasoning. Knowledge reasoning, a primary type of reasoning, aims at deriving
new knowledge from existing one.While it has been widely studied in the context
of knowledge graphs (KGs), knowledge reasoning in LLMs remains underexplored.
In this paper, we introduce Chain-of-Knowledge, a comprehensive framework for
knowledge reasoning, including methodologies for both dataset construction and
model learning. For dataset construction, we create KnowReason via rule mining
on KGs. For model learning, we observe rule overfitting induced by naive
training. Hence, we enhance CoK with a trial-and-error mechanism that simulates
the human process of internal knowledge exploration. We conduct extensive
experiments with KnowReason. Our results show the effectiveness of CoK in
refining LLMs in not only knowledge reasoning, but also general reasoning
benchmarkms.Summary
AI-Generated Summary