ChatPaper.aiChatPaper

BYOKG-RAG: Многостратегическое извлечение данных из графов для ответов на вопросы по графам знаний

BYOKG-RAG: Multi-Strategy Graph Retrieval for Knowledge Graph Question Answering

July 5, 2025
Авторы: Costas Mavromatis, Soji Adeshina, Vassilis N. Ioannidis, Zhen Han, Qi Zhu, Ian Robinson, Bryan Thompson, Huzefa Rangwala, George Karypis
cs.AI

Аннотация

Ответы на вопросы по графам знаний (KGQA) представляют значительные трудности из-за структурных и семантических вариаций во входных графах. Существующие подходы полагаются на агентов, основанных на больших языковых моделях (LLM), для обхода графов и извлечения данных; такой метод чувствителен к инициализации обхода, так как он подвержен ошибкам связывания сущностей и может плохо обобщаться на пользовательские ("bring-your-own") графы знаний. Мы представляем BYOKG-RAG — фреймворк, который улучшает KGQA за счет синергетического сочетания LLM со специализированными инструментами для извлечения данных из графов. В BYOKG-RAG LLM генерируют ключевые артефакты графа (сущности вопросов, кандидаты на ответы, пути рассуждений и запросы на языке OpenCypher), а инструменты для работы с графами связывают эти артефакты с графом знаний и извлекают соответствующий контекст. Извлеченный контекст позволяет LLM итеративно уточнять связывание и извлечение данных из графа перед генерацией окончательного ответа. Благодаря извлечению контекста с использованием различных инструментов для работы с графами, BYOKG-RAG предлагает более универсальное и устойчивое решение для ответов на вопросы по пользовательским графам знаний. В экспериментах на пяти бенчмарках, охватывающих различные типы графов знаний, мы демонстрируем, что BYOKG-RAG превосходит второй лучший метод извлечения данных из графов на 4,5 процентных пункта, показывая при этом лучшее обобщение на пользовательские графы знаний. Фреймворк BYOKG-RAG доступен в открытом исходном коде по адресу https://github.com/awslabs/graphrag-toolkit.
English
Knowledge graph question answering (KGQA) presents significant challenges due to the structural and semantic variations across input graphs. Existing works rely on Large Language Model (LLM) agents for graph traversal and retrieval; an approach that is sensitive to traversal initialization, as it is prone to entity linking errors and may not generalize well to custom ("bring-your-own") KGs. We introduce BYOKG-RAG, a framework that enhances KGQA by synergistically combining LLMs with specialized graph retrieval tools. In BYOKG-RAG, LLMs generate critical graph artifacts (question entities, candidate answers, reasoning paths, and OpenCypher queries), and graph tools link these artifacts to the KG and retrieve relevant graph context. The retrieved context enables the LLM to iteratively refine its graph linking and retrieval, before final answer generation. By retrieving context from different graph tools, BYOKG-RAG offers a more general and robust solution for QA over custom KGs. Through experiments on five benchmarks spanning diverse KG types, we demonstrate that BYOKG-RAG outperforms the second-best graph retrieval method by 4.5% points while showing better generalization to custom KGs. BYOKG-RAG framework is open-sourced at https://github.com/awslabs/graphrag-toolkit.
PDF41July 16, 2025