ChatPaper.aiChatPaper

NodeRAG: Структурирование графового RAG с использованием гетерогенных узлов

NodeRAG: Structuring Graph-based RAG with Heterogeneous Nodes

April 15, 2025
Авторы: Tianyang Xu, Haojie Zheng, Chengze Li, Haoxiang Chen, Yixin Liu, Ruoxi Chen, Lichao Sun
cs.AI

Аннотация

Генерация, усиленная поиском (RAG), позволяет крупным языковым моделям получать доступ к внешним и частным корпусам данных, обеспечивая фактологически согласованные ответы в конкретных предметных областях. Используя внутреннюю структуру корпуса, графовые методы RAG дополнительно обогащают этот процесс, создавая индекс графа знаний и используя структурные свойства графов. Однако современные графовые подходы RAG редко уделяют внимание проектированию графовых структур. Недостаточно продуманные графы не только затрудняют бесшовную интеграцию разнообразных графовых алгоритмов, но и приводят к несогласованности рабочих процессов и снижению производительности. Чтобы раскрыть весь потенциал графов для RAG, мы предлагаем NodeRAG — графоцентричную структуру, которая вводит гетерогенные графовые структуры, позволяющие бесшовно и целостно интегрировать графовые методологии в рабочий процесс RAG. Благодаря тесному соответствию возможностям крупных языковых моделей, эта структура обеспечивает полностью согласованный и эффективный сквозной процесс. В ходе обширных экспериментов мы демонстрируем, что NodeRAG превосходит предыдущие методы, включая GraphRAG и LightRAG, не только по времени индексации, времени запроса и эффективности хранения, но и по качеству ответов на вопросы в многозвенных тестах и открытых сравнительных оценках с минимальным количеством извлекаемых токенов. Наш репозиторий на GitHub доступен по ссылке: https://github.com/Terry-Xu-666/NodeRAG.
English
Retrieval-augmented generation (RAG) empowers large language models to access external and private corpus, enabling factually consistent responses in specific domains. By exploiting the inherent structure of the corpus, graph-based RAG methods further enrich this process by building a knowledge graph index and leveraging the structural nature of graphs. However, current graph-based RAG approaches seldom prioritize the design of graph structures. Inadequately designed graph not only impede the seamless integration of diverse graph algorithms but also result in workflow inconsistencies and degraded performance. To further unleash the potential of graph for RAG, we propose NodeRAG, a graph-centric framework introducing heterogeneous graph structures that enable the seamless and holistic integration of graph-based methodologies into the RAG workflow. By aligning closely with the capabilities of LLMs, this framework ensures a fully cohesive and efficient end-to-end process. Through extensive experiments, we demonstrate that NodeRAG exhibits performance advantages over previous methods, including GraphRAG and LightRAG, not only in indexing time, query time, and storage efficiency but also in delivering superior question-answering performance on multi-hop benchmarks and open-ended head-to-head evaluations with minimal retrieval tokens. Our GitHub repository could be seen at https://github.com/Terry-Xu-666/NodeRAG.

Summary

AI-Generated Summary

PDF412April 21, 2025