Compilador de Consultas Neuro-Simbólico
Neuro-Symbolic Query Compiler
May 17, 2025
Autores: Yuyao Zhang, Zhicheng Dou, Xiaoxi Li, Jiajie Jin, Yongkang Wu, Zhonghua Li, Qi Ye, Ji-Rong Wen
cs.AI
Resumen
El reconocimiento preciso de la intención de búsqueda en los sistemas de Generación Aumentada por Recuperación (RAG, por sus siglas en inglés) sigue siendo un objetivo desafiante, especialmente bajo restricciones de recursos y para consultas complejas con estructuras anidadas y dependencias. Este artículo presenta QCompiler, un marco neuro-simbólico inspirado en las reglas gramaticales lingüísticas y el diseño de compiladores, para cerrar esta brecha. Teóricamente, se diseña una gramática mínima pero suficiente en Forma de Backus-Naur (BNF) G[q] para formalizar consultas complejas. A diferencia de métodos anteriores, esta gramática mantiene la completitud mientras minimiza la redundancia. Basado en esto, QCompiler incluye un Traductor de Expresiones de Consulta, un Analizador Sintáctico Léxico y un Procesador de Descenso Recursivo para compilar consultas en Árboles de Sintaxis Abstracta (AST, por sus siglas en inglés) para su ejecución. La atomicidad de las subconsultas en los nodos hoja garantiza una recuperación de documentos y una generación de respuestas más precisas, mejorando significativamente la capacidad del sistema RAG para abordar consultas complejas.
English
Precise recognition of search intent in Retrieval-Augmented Generation (RAG)
systems remains a challenging goal, especially under resource constraints and
for complex queries with nested structures and dependencies. This paper
presents QCompiler, a neuro-symbolic framework inspired by linguistic grammar
rules and compiler design, to bridge this gap. It theoretically designs a
minimal yet sufficient Backus-Naur Form (BNF) grammar G[q] to formalize
complex queries. Unlike previous methods, this grammar maintains completeness
while minimizing redundancy. Based on this, QCompiler includes a Query
Expression Translator, a Lexical Syntax Parser, and a Recursive Descent
Processor to compile queries into Abstract Syntax Trees (ASTs) for execution.
The atomicity of the sub-queries in the leaf nodes ensures more precise
document retrieval and response generation, significantly improving the RAG
system's ability to address complex queries.Summary
AI-Generated Summary