신경-기호 쿼리 컴파일러
Neuro-Symbolic Query Compiler
May 17, 2025
저자: Yuyao Zhang, Zhicheng Dou, Xiaoxi Li, Jiajie Jin, Yongkang Wu, Zhonghua Li, Qi Ye, Ji-Rong Wen
cs.AI
초록
검색 의도의 정확한 인식은 특히 자원 제약과 중첩 구조 및 의존성을 가진 복잡한 쿼리에서 Retrieval-Augmented Generation (RAG) 시스템의 주요 과제로 남아 있습니다. 본 논문은 이러한 격차를 해소하기 위해 언어학적 문법 규칙과 컴파일러 설계에서 영감을 받은 신경-기호적 프레임워크인 QCompiler를 제안합니다. 이 프레임워크는 복잡한 쿼리를 형식화하기 위해 최소한이면서도 충분한 Backus-Naur Form (BNF) 문법 G[q]를 이론적으로 설계합니다. 기존 방법과 달리, 이 문법은 중복성을 최소화하면서도 완전성을 유지합니다. 이를 기반으로 QCompiler는 쿼리를 Abstract Syntax Trees (ASTs)로 컴파일하여 실행하기 위한 Query Expression Translator, Lexical Syntax Parser, 그리고 Recursive Descent Processor를 포함합니다. 리프 노드에 있는 하위 쿼리의 원자성은 더 정확한 문서 검색과 응답 생성을 보장하며, 이를 통해 RAG 시스템의 복잡한 쿼리 처리 능력을 크게 향상시킵니다.
English
Precise recognition of search intent in Retrieval-Augmented Generation (RAG)
systems remains a challenging goal, especially under resource constraints and
for complex queries with nested structures and dependencies. This paper
presents QCompiler, a neuro-symbolic framework inspired by linguistic grammar
rules and compiler design, to bridge this gap. It theoretically designs a
minimal yet sufficient Backus-Naur Form (BNF) grammar G[q] to formalize
complex queries. Unlike previous methods, this grammar maintains completeness
while minimizing redundancy. Based on this, QCompiler includes a Query
Expression Translator, a Lexical Syntax Parser, and a Recursive Descent
Processor to compile queries into Abstract Syntax Trees (ASTs) for execution.
The atomicity of the sub-queries in the leaf nodes ensures more precise
document retrieval and response generation, significantly improving the RAG
system's ability to address complex queries.Summary
AI-Generated Summary