ChatPaper.aiChatPaper

Neuro-Symbolischer Abfragecompiler

Neuro-Symbolic Query Compiler

May 17, 2025
Autoren: Yuyao Zhang, Zhicheng Dou, Xiaoxi Li, Jiajie Jin, Yongkang Wu, Zhonghua Li, Qi Ye, Ji-Rong Wen
cs.AI

Zusammenfassung

Die präzise Erkennung der Suchintention in Retrieval-Augmented Generation (RAG)-Systemen bleibt ein herausforderndes Ziel, insbesondere unter Ressourcenbeschränkungen und bei komplexen Abfragen mit verschachtelten Strukturen und Abhängigkeiten. Dieses Papier stellt QCompiler vor, ein neuro-symbolisches Framework, das von linguistischen Grammatikregeln und Compiler-Design inspiriert ist, um diese Lücke zu schließen. Es entwirft theoretisch eine minimale, aber ausreichende Backus-Naur-Form (BNF)-Grammatik G[q], um komplexe Abfragen zu formalisieren. Im Gegensatz zu früheren Methoden bewahrt diese Grammatik die Vollständigkeit, während sie Redundanz minimiert. Basierend darauf umfasst QCompiler einen Abfrageausdrucks-Übersetzer, einen lexikalischen Syntax-Parser und einen rekursiven Abstiegsprozessor, um Abfragen in abstrakte Syntaxbäume (ASTs) für die Ausführung zu kompilieren. Die Atomarität der Teilabfragen in den Blattknoten gewährleistet eine präzisere Dokumentenabruf- und Antwortgenerierung, wodurch die Fähigkeit des RAG-Systems, komplexe Abfragen zu bearbeiten, erheblich verbessert wird.
English
Precise recognition of search intent in Retrieval-Augmented Generation (RAG) systems remains a challenging goal, especially under resource constraints and for complex queries with nested structures and dependencies. This paper presents QCompiler, a neuro-symbolic framework inspired by linguistic grammar rules and compiler design, to bridge this gap. It theoretically designs a minimal yet sufficient Backus-Naur Form (BNF) grammar G[q] to formalize complex queries. Unlike previous methods, this grammar maintains completeness while minimizing redundancy. Based on this, QCompiler includes a Query Expression Translator, a Lexical Syntax Parser, and a Recursive Descent Processor to compile queries into Abstract Syntax Trees (ASTs) for execution. The atomicity of the sub-queries in the leaf nodes ensures more precise document retrieval and response generation, significantly improving the RAG system's ability to address complex queries.

Summary

AI-Generated Summary

PDF143May 20, 2025