Cadena de Conocimiento: Integración del Razonamiento de Conocimiento en Modelos de Lenguaje a Gran Escala mediante el Aprendizaje a partir de Grafos de Conocimiento
Chain-of-Knowledge: Integrating Knowledge Reasoning into Large Language Models by Learning from Knowledge Graphs
June 30, 2024
Autores: Yifei Zhang, Xintao Wang, Jiaqing Liang, Sirui Xia, Lida Chen, Yanghua Xiao
cs.AI
Resumen
Los Modelos de Lenguaje de Gran Escala (LLMs, por sus siglas en inglés) han demostrado una impresionante competencia en diversas tareas de procesamiento del lenguaje natural (NLP, por sus siglas en inglés), las cuales involucran razonamientos cada vez más complejos. El razonamiento basado en conocimiento, un tipo principal de razonamiento, tiene como objetivo derivar nuevo conocimiento a partir del existente. Aunque ha sido ampliamente estudiado en el contexto de grafos de conocimiento (KGs, por sus siglas en inglés), el razonamiento basado en conocimiento en LLMs sigue siendo poco explorado. En este artículo, presentamos Chain-of-Knowledge (CoK), un marco integral para el razonamiento basado en conocimiento, que incluye metodologías tanto para la construcción de conjuntos de datos como para el aprendizaje de modelos. Para la construcción de conjuntos de datos, creamos KnowReason mediante la minería de reglas en KGs. Para el aprendizaje de modelos, observamos un sobreajuste de reglas inducido por un entrenamiento ingenuo. Por lo tanto, mejoramos CoK con un mecanismo de prueba y error que simula el proceso humano de exploración interna del conocimiento. Realizamos experimentos extensivos con KnowReason. Nuestros resultados muestran la efectividad de CoK en la mejora de LLMs no solo en el razonamiento basado en conocimiento, sino también en puntos de referencia generales de razonamiento.
English
Large Language Models (LLMs) have exhibited impressive proficiency in various
natural language processing (NLP) tasks, which involve increasingly complex
reasoning. Knowledge reasoning, a primary type of reasoning, aims at deriving
new knowledge from existing one.While it has been widely studied in the context
of knowledge graphs (KGs), knowledge reasoning in LLMs remains underexplored.
In this paper, we introduce Chain-of-Knowledge, a comprehensive framework for
knowledge reasoning, including methodologies for both dataset construction and
model learning. For dataset construction, we create KnowReason via rule mining
on KGs. For model learning, we observe rule overfitting induced by naive
training. Hence, we enhance CoK with a trial-and-error mechanism that simulates
the human process of internal knowledge exploration. We conduct extensive
experiments with KnowReason. Our results show the effectiveness of CoK in
refining LLMs in not only knowledge reasoning, but also general reasoning
benchmarkms.Summary
AI-Generated Summary