Нейро-символьный компилятор запросов
Neuro-Symbolic Query Compiler
May 17, 2025
Авторы: Yuyao Zhang, Zhicheng Dou, Xiaoxi Li, Jiajie Jin, Yongkang Wu, Zhonghua Li, Qi Ye, Ji-Rong Wen
cs.AI
Аннотация
Точное распознавание поискового намерения в системах Retrieval-Augmented Generation (RAG) остается сложной задачей, особенно в условиях ограниченных ресурсов и для сложных запросов с вложенными структурами и зависимостями. В данной статье представлен QCompiler, нейро-символический фреймворк, вдохновленный правилами лингвистической грамматики и проектированием компиляторов, который призван устранить этот пробел. Теоретически разработана минимальная, но достаточная грамматика в форме Бэкуса-Наура (BNF) G[q] для формализации сложных запросов. В отличие от предыдущих методов, эта грамматика сохраняет полноту, минимизируя избыточность. На основе этого QCompiler включает в себя Переводчик выражений запросов, Лексический синтаксический анализатор и Рекурсивный нисходящий процессор для компиляции запросов в абстрактные синтаксические деревья (AST) для выполнения. Атомарность подзапросов в листовых узлах обеспечивает более точное извлечение документов и генерацию ответов, значительно улучшая способность системы RAG обрабатывать сложные запросы.
English
Precise recognition of search intent in Retrieval-Augmented Generation (RAG)
systems remains a challenging goal, especially under resource constraints and
for complex queries with nested structures and dependencies. This paper
presents QCompiler, a neuro-symbolic framework inspired by linguistic grammar
rules and compiler design, to bridge this gap. It theoretically designs a
minimal yet sufficient Backus-Naur Form (BNF) grammar G[q] to formalize
complex queries. Unlike previous methods, this grammar maintains completeness
while minimizing redundancy. Based on this, QCompiler includes a Query
Expression Translator, a Lexical Syntax Parser, and a Recursive Descent
Processor to compile queries into Abstract Syntax Trees (ASTs) for execution.
The atomicity of the sub-queries in the leaf nodes ensures more precise
document retrieval and response generation, significantly improving the RAG
system's ability to address complex queries.Summary
AI-Generated Summary