Neuro-Symbolische Query Compiler
Neuro-Symbolic Query Compiler
May 17, 2025
Auteurs: Yuyao Zhang, Zhicheng Dou, Xiaoxi Li, Jiajie Jin, Yongkang Wu, Zhonghua Li, Qi Ye, Ji-Rong Wen
cs.AI
Samenvatting
Het nauwkeurig herkennen van zoekintentie in Retrieval-Augmented Generation (RAG)-systemen blijft een uitdagend doel, vooral onder beperkte middelen en voor complexe query's met geneste structuren en afhankelijkheden. Dit artikel introduceert QCompiler, een neuro-symbolisch raamwerk geïnspireerd door linguïstische grammaticaregels en compilatorontwerp, om deze kloof te overbruggen. Het ontwerpt theoretisch een minimale maar voldoende Backus-Naur Form (BNF)-grammatica G[q] om complexe query's te formaliseren. In tegenstelling tot eerdere methoden behoudt deze grammatica volledigheid terwijl redundantie wordt geminimaliseerd. Op basis hiervan omvat QCompiler een Query Expression Translator, een Lexical Syntax Parser en een Recursive Descent Processor om query's te compileren naar Abstract Syntax Trees (AST's) voor uitvoering. De atomiciteit van de subquery's in de bladknopen zorgt voor nauwkeurigere documentretrieval en responsgeneratie, wat het vermogen van het RAG-systeem om complexe query's aan te pakken aanzienlijk verbetert.
English
Precise recognition of search intent in Retrieval-Augmented Generation (RAG)
systems remains a challenging goal, especially under resource constraints and
for complex queries with nested structures and dependencies. This paper
presents QCompiler, a neuro-symbolic framework inspired by linguistic grammar
rules and compiler design, to bridge this gap. It theoretically designs a
minimal yet sufficient Backus-Naur Form (BNF) grammar G[q] to formalize
complex queries. Unlike previous methods, this grammar maintains completeness
while minimizing redundancy. Based on this, QCompiler includes a Query
Expression Translator, a Lexical Syntax Parser, and a Recursive Descent
Processor to compile queries into Abstract Syntax Trees (ASTs) for execution.
The atomicity of the sub-queries in the leaf nodes ensures more precise
document retrieval and response generation, significantly improving the RAG
system's ability to address complex queries.Summary
AI-Generated Summary