ChatPaper.aiChatPaper

Цепочка знаний: Интеграция логического вывода знаний в крупномасштабные языковые модели путем обучения на графах знаний.

Chain-of-Knowledge: Integrating Knowledge Reasoning into Large Language Models by Learning from Knowledge Graphs

June 30, 2024
Авторы: Yifei Zhang, Xintao Wang, Jiaqing Liang, Sirui Xia, Lida Chen, Yanghua Xiao
cs.AI

Аннотация

Большие языковые модели (LLM) продемонстрировали впечатляющую компетентность в различных задачах обработки естественного языка (NLP), которые включают в себя все более сложное рассуждение. Рассуждение на основе знаний, основной тип рассуждения, направлено на вывод новых знаний из существующих. Хотя оно широко изучалось в контексте графов знаний (KG), рассуждение на основе знаний в LLM остается мало исследованным. В данной статье мы представляем Chain-of-Knowledge, комплексную структуру для рассуждения на основе знаний, включая методики как для построения набора данных, так и для обучения модели. Для построения набора данных мы создаем KnowReason с помощью добычи правил на основе графов знаний. Для обучения модели мы наблюдаем переобучение на правилах, вызванное наивным обучением. Поэтому мы улучшаем CoK механизмом проб и ошибок, который имитирует процесс внутреннего исследования знаний человека. Мы проводим обширные эксперименты с KnowReason. Наши результаты показывают эффективность CoK не только в улучшении LLM в рассуждениях на основе знаний, но и в общих бенчмарках рассуждения.
English
Large Language Models (LLMs) have exhibited impressive proficiency in various natural language processing (NLP) tasks, which involve increasingly complex reasoning. Knowledge reasoning, a primary type of reasoning, aims at deriving new knowledge from existing one.While it has been widely studied in the context of knowledge graphs (KGs), knowledge reasoning in LLMs remains underexplored. In this paper, we introduce Chain-of-Knowledge, a comprehensive framework for knowledge reasoning, including methodologies for both dataset construction and model learning. For dataset construction, we create KnowReason via rule mining on KGs. For model learning, we observe rule overfitting induced by naive training. Hence, we enhance CoK with a trial-and-error mechanism that simulates the human process of internal knowledge exploration. We conduct extensive experiments with KnowReason. Our results show the effectiveness of CoK in refining LLMs in not only knowledge reasoning, but also general reasoning benchmarkms.

Summary

AI-Generated Summary

PDF122November 28, 2024