Compilatore di Query Neuro-Simbolico
Neuro-Symbolic Query Compiler
May 17, 2025
Autori: Yuyao Zhang, Zhicheng Dou, Xiaoxi Li, Jiajie Jin, Yongkang Wu, Zhonghua Li, Qi Ye, Ji-Rong Wen
cs.AI
Abstract
Il riconoscimento preciso dell'intento di ricerca nei sistemi di Generazione Aumentata dal Recupero (RAG) rimane un obiettivo impegnativo, specialmente in contesti con risorse limitate e per query complesse con strutture annidate e dipendenze. Questo articolo presenta QCompiler, un framework neuro-simbolico ispirato alle regole grammaticali linguistiche e al design dei compilatori, per colmare questa lacuna. Teoricamente, progetta una grammatica Backus-Naur Form (BNF) minima ma sufficiente G[q] per formalizzare query complesse. A differenza dei metodi precedenti, questa grammatica mantiene la completezza riducendo al minimo la ridondanza. Su questa base, QCompiler include un Traduttore di Espressioni di Query, un Parser Sintattico Lessicale e un Processore a Discesa Ricorsiva per compilare le query in Alberi Sintattici Astratti (AST) per l'esecuzione. L'atomicità delle sotto-query nei nodi foglia garantisce un recupero dei documenti e una generazione delle risposte più precisi, migliorando significativamente la capacità del sistema RAG di gestire query complesse.
English
Precise recognition of search intent in Retrieval-Augmented Generation (RAG)
systems remains a challenging goal, especially under resource constraints and
for complex queries with nested structures and dependencies. This paper
presents QCompiler, a neuro-symbolic framework inspired by linguistic grammar
rules and compiler design, to bridge this gap. It theoretically designs a
minimal yet sufficient Backus-Naur Form (BNF) grammar G[q] to formalize
complex queries. Unlike previous methods, this grammar maintains completeness
while minimizing redundancy. Based on this, QCompiler includes a Query
Expression Translator, a Lexical Syntax Parser, and a Recursive Descent
Processor to compile queries into Abstract Syntax Trees (ASTs) for execution.
The atomicity of the sub-queries in the leaf nodes ensures more precise
document retrieval and response generation, significantly improving the RAG
system's ability to address complex queries.