ChatPaper.aiChatPaper

Neuro-Symbolische Query Compiler

Neuro-Symbolic Query Compiler

May 17, 2025
Auteurs: Yuyao Zhang, Zhicheng Dou, Xiaoxi Li, Jiajie Jin, Yongkang Wu, Zhonghua Li, Qi Ye, Ji-Rong Wen
cs.AI

Samenvatting

Het nauwkeurig herkennen van zoekintentie in Retrieval-Augmented Generation (RAG)-systemen blijft een uitdagend doel, vooral onder beperkte middelen en voor complexe query's met geneste structuren en afhankelijkheden. Dit artikel introduceert QCompiler, een neuro-symbolisch raamwerk geïnspireerd door linguïstische grammaticaregels en compilatorontwerp, om deze kloof te overbruggen. Het ontwerpt theoretisch een minimale maar voldoende Backus-Naur Form (BNF)-grammatica G[q] om complexe query's te formaliseren. In tegenstelling tot eerdere methoden behoudt deze grammatica volledigheid terwijl redundantie wordt geminimaliseerd. Op basis hiervan omvat QCompiler een Query Expression Translator, een Lexical Syntax Parser en een Recursive Descent Processor om query's te compileren naar Abstract Syntax Trees (AST's) voor uitvoering. De atomiciteit van de subquery's in de bladknopen zorgt voor nauwkeurigere documentretrieval en responsgeneratie, wat het vermogen van het RAG-systeem om complexe query's aan te pakken aanzienlijk verbetert.
English
Precise recognition of search intent in Retrieval-Augmented Generation (RAG) systems remains a challenging goal, especially under resource constraints and for complex queries with nested structures and dependencies. This paper presents QCompiler, a neuro-symbolic framework inspired by linguistic grammar rules and compiler design, to bridge this gap. It theoretically designs a minimal yet sufficient Backus-Naur Form (BNF) grammar G[q] to formalize complex queries. Unlike previous methods, this grammar maintains completeness while minimizing redundancy. Based on this, QCompiler includes a Query Expression Translator, a Lexical Syntax Parser, and a Recursive Descent Processor to compile queries into Abstract Syntax Trees (ASTs) for execution. The atomicity of the sub-queries in the leaf nodes ensures more precise document retrieval and response generation, significantly improving the RAG system's ability to address complex queries.

Summary

AI-Generated Summary

PDF143May 20, 2025