ニューロシンボリッククエリコンパイラ
Neuro-Symbolic Query Compiler
May 17, 2025
著者: Yuyao Zhang, Zhicheng Dou, Xiaoxi Li, Jiajie Jin, Yongkang Wu, Zhonghua Li, Qi Ye, Ji-Rong Wen
cs.AI
要旨
検索意図の正確な認識は、リソース制約やネスト構造や依存関係を持つ複雑なクエリにおいて、特にRetrieval-Augmented Generation(RAG)システムにおいて依然として困難な課題である。本論文では、このギャップを埋めるために、言語学的文法規則とコンパイラ設計に着想を得たニューロシンボリックフレームワークであるQCompilerを提案する。QCompilerは、複雑なクエリを形式化するために、最小限でありながら十分なBackus-Naur Form(BNF)文法G[q]を理論的に設計する。従来の手法とは異なり、この文法は冗長性を最小化しつつ完全性を維持する。これに基づき、QCompilerはクエリを抽象構文木(AST)にコンパイルするためのクエリ式翻訳器、字句構文解析器、および再帰下降処理器を含む。リーフノードにおけるサブクエリの原子性は、より正確な文書検索と応答生成を保証し、RAGシステムの複雑なクエリへの対応能力を大幅に向上させる。
English
Precise recognition of search intent in Retrieval-Augmented Generation (RAG)
systems remains a challenging goal, especially under resource constraints and
for complex queries with nested structures and dependencies. This paper
presents QCompiler, a neuro-symbolic framework inspired by linguistic grammar
rules and compiler design, to bridge this gap. It theoretically designs a
minimal yet sufficient Backus-Naur Form (BNF) grammar G[q] to formalize
complex queries. Unlike previous methods, this grammar maintains completeness
while minimizing redundancy. Based on this, QCompiler includes a Query
Expression Translator, a Lexical Syntax Parser, and a Recursive Descent
Processor to compile queries into Abstract Syntax Trees (ASTs) for execution.
The atomicity of the sub-queries in the leaf nodes ensures more precise
document retrieval and response generation, significantly improving the RAG
system's ability to address complex queries.Summary
AI-Generated Summary