ChatPaper.aiChatPaper

Compilatore di Query Neuro-Simbolico

Neuro-Symbolic Query Compiler

May 17, 2025
Autori: Yuyao Zhang, Zhicheng Dou, Xiaoxi Li, Jiajie Jin, Yongkang Wu, Zhonghua Li, Qi Ye, Ji-Rong Wen
cs.AI

Abstract

Il riconoscimento preciso dell'intento di ricerca nei sistemi di Generazione Aumentata dal Recupero (RAG) rimane un obiettivo impegnativo, specialmente in contesti con risorse limitate e per query complesse con strutture annidate e dipendenze. Questo articolo presenta QCompiler, un framework neuro-simbolico ispirato alle regole grammaticali linguistiche e al design dei compilatori, per colmare questa lacuna. Teoricamente, progetta una grammatica Backus-Naur Form (BNF) minima ma sufficiente G[q] per formalizzare query complesse. A differenza dei metodi precedenti, questa grammatica mantiene la completezza riducendo al minimo la ridondanza. Su questa base, QCompiler include un Traduttore di Espressioni di Query, un Parser Sintattico Lessicale e un Processore a Discesa Ricorsiva per compilare le query in Alberi Sintattici Astratti (AST) per l'esecuzione. L'atomicità delle sotto-query nei nodi foglia garantisce un recupero dei documenti e una generazione delle risposte più precisi, migliorando significativamente la capacità del sistema RAG di gestire query complesse.
English
Precise recognition of search intent in Retrieval-Augmented Generation (RAG) systems remains a challenging goal, especially under resource constraints and for complex queries with nested structures and dependencies. This paper presents QCompiler, a neuro-symbolic framework inspired by linguistic grammar rules and compiler design, to bridge this gap. It theoretically designs a minimal yet sufficient Backus-Naur Form (BNF) grammar G[q] to formalize complex queries. Unlike previous methods, this grammar maintains completeness while minimizing redundancy. Based on this, QCompiler includes a Query Expression Translator, a Lexical Syntax Parser, and a Recursive Descent Processor to compile queries into Abstract Syntax Trees (ASTs) for execution. The atomicity of the sub-queries in the leaf nodes ensures more precise document retrieval and response generation, significantly improving the RAG system's ability to address complex queries.
PDF163May 20, 2025