Cadena de Conocimiento: Integración del Razonamiento de Conocimiento en Modelos de Lenguaje a Gran Escala mediante el Aprendizaje a partir de Grafos de Conocimiento

Resumen

Los Modelos de Lenguaje de Gran Escala (LLMs, por sus siglas en inglés) han demostrado una impresionante competencia en diversas tareas de procesamiento del lenguaje natural (NLP, por sus siglas en inglés), las cuales involucran razonamientos cada vez más complejos. El razonamiento basado en conocimiento, un tipo principal de razonamiento, tiene como objetivo derivar nuevo conocimiento a partir del existente. Aunque ha sido ampliamente estudiado en el contexto de grafos de conocimiento (KGs, por sus siglas en inglés), el razonamiento basado en conocimiento en LLMs sigue siendo poco explorado. En este artículo, presentamos Chain-of-Knowledge (CoK), un marco integral para el razonamiento basado en conocimiento, que incluye metodologías tanto para la construcción de conjuntos de datos como para el aprendizaje de modelos. Para la construcción de conjuntos de datos, creamos KnowReason mediante la minería de reglas en KGs. Para el aprendizaje de modelos, observamos un sobreajuste de reglas inducido por un entrenamiento ingenuo. Por lo tanto, mejoramos CoK con un mecanismo de prueba y error que simula el proceso humano de exploración interna del conocimiento. Realizamos experimentos extensivos con KnowReason. Nuestros resultados muestran la efectividad de CoK en la mejora de LLMs no solo en el razonamiento basado en conocimiento, sino también en puntos de referencia generales de razonamiento.

English

Large Language Models (LLMs) have exhibited impressive proficiency in various natural language processing (NLP) tasks, which involve increasingly complex reasoning. Knowledge reasoning, a primary type of reasoning, aims at deriving new knowledge from existing one.While it has been widely studied in the context of knowledge graphs (KGs), knowledge reasoning in LLMs remains underexplored. In this paper, we introduce Chain-of-Knowledge, a comprehensive framework for knowledge reasoning, including methodologies for both dataset construction and model learning. For dataset construction, we create KnowReason via rule mining on KGs. For model learning, we observe rule overfitting induced by naive training. Hence, we enhance CoK with a trial-and-error mechanism that simulates the human process of internal knowledge exploration. We conduct extensive experiments with KnowReason. Our results show the effectiveness of CoK in refining LLMs in not only knowledge reasoning, but also general reasoning benchmarkms.

Cadena de Conocimiento: Integración del Razonamiento de Conocimiento en Modelos de Lenguaje a Gran Escala mediante el Aprendizaje a partir de Grafos de Conocimiento

Chain-of-Knowledge: Integrating Knowledge Reasoning into Large Language Models by Learning from Knowledge Graphs

Resumen

Support