Compilateur de Requêtes Neuro-Symbolique
Neuro-Symbolic Query Compiler
May 17, 2025
Auteurs: Yuyao Zhang, Zhicheng Dou, Xiaoxi Li, Jiajie Jin, Yongkang Wu, Zhonghua Li, Qi Ye, Ji-Rong Wen
cs.AI
Résumé
La reconnaissance précise de l'intention de recherche dans les systèmes de Génération Augmentée par Récupération (RAG) reste un objectif difficile à atteindre, en particulier dans des conditions de ressources limitées et pour des requêtes complexes comportant des structures imbriquées et des dépendances. Cet article présente QCompiler, un cadre neuro-symbolique inspiré des règles de grammaire linguistique et de la conception de compilateurs, visant à combler cette lacune. Il conçoit théoriquement une grammaire minimale mais suffisante sous forme de Backus-Naur (BNF) G[q] pour formaliser les requêtes complexes. Contrairement aux méthodes précédentes, cette grammaire maintient l'exhaustivité tout en minimisant la redondance. Sur cette base, QCompiler intègre un Traducteur d'Expressions de Requêtes, un Analyseur Syntaxique Lexical et un Processeur de Descente Récursive pour compiler les requêtes en Arbres Syntaxiques Abstraits (AST) en vue de leur exécution. L'atomicité des sous-requêtes dans les nœuds feuilles garantit une récupération de documents et une génération de réponses plus précises, améliorant ainsi significativement la capacité du système RAG à traiter des requêtes complexes.
English
Precise recognition of search intent in Retrieval-Augmented Generation (RAG)
systems remains a challenging goal, especially under resource constraints and
for complex queries with nested structures and dependencies. This paper
presents QCompiler, a neuro-symbolic framework inspired by linguistic grammar
rules and compiler design, to bridge this gap. It theoretically designs a
minimal yet sufficient Backus-Naur Form (BNF) grammar G[q] to formalize
complex queries. Unlike previous methods, this grammar maintains completeness
while minimizing redundancy. Based on this, QCompiler includes a Query
Expression Translator, a Lexical Syntax Parser, and a Recursive Descent
Processor to compile queries into Abstract Syntax Trees (ASTs) for execution.
The atomicity of the sub-queries in the leaf nodes ensures more precise
document retrieval and response generation, significantly improving the RAG
system's ability to address complex queries.Summary
AI-Generated Summary