ChatPaper.aiChatPaper

Нейро-символьный компилятор запросов

Neuro-Symbolic Query Compiler

May 17, 2025
Авторы: Yuyao Zhang, Zhicheng Dou, Xiaoxi Li, Jiajie Jin, Yongkang Wu, Zhonghua Li, Qi Ye, Ji-Rong Wen
cs.AI

Аннотация

Точное распознавание поискового намерения в системах Retrieval-Augmented Generation (RAG) остается сложной задачей, особенно в условиях ограниченных ресурсов и для сложных запросов с вложенными структурами и зависимостями. В данной статье представлен QCompiler, нейро-символический фреймворк, вдохновленный правилами лингвистической грамматики и проектированием компиляторов, который призван устранить этот пробел. Теоретически разработана минимальная, но достаточная грамматика в форме Бэкуса-Наура (BNF) G[q] для формализации сложных запросов. В отличие от предыдущих методов, эта грамматика сохраняет полноту, минимизируя избыточность. На основе этого QCompiler включает в себя Переводчик выражений запросов, Лексический синтаксический анализатор и Рекурсивный нисходящий процессор для компиляции запросов в абстрактные синтаксические деревья (AST) для выполнения. Атомарность подзапросов в листовых узлах обеспечивает более точное извлечение документов и генерацию ответов, значительно улучшая способность системы RAG обрабатывать сложные запросы.
English
Precise recognition of search intent in Retrieval-Augmented Generation (RAG) systems remains a challenging goal, especially under resource constraints and for complex queries with nested structures and dependencies. This paper presents QCompiler, a neuro-symbolic framework inspired by linguistic grammar rules and compiler design, to bridge this gap. It theoretically designs a minimal yet sufficient Backus-Naur Form (BNF) grammar G[q] to formalize complex queries. Unlike previous methods, this grammar maintains completeness while minimizing redundancy. Based on this, QCompiler includes a Query Expression Translator, a Lexical Syntax Parser, and a Recursive Descent Processor to compile queries into Abstract Syntax Trees (ASTs) for execution. The atomicity of the sub-queries in the leaf nodes ensures more precise document retrieval and response generation, significantly improving the RAG system's ability to address complex queries.

Summary

AI-Generated Summary

PDF143May 20, 2025