ChatPaper.aiChatPaper

Construção de Base de Conhecimento para Text-to-SQL Aumentado por Conhecimento

Knowledge Base Construction for Knowledge-Augmented Text-to-SQL

May 28, 2025
Autores: Jinheon Baek, Horst Samulowitz, Oktie Hassanzadeh, Dharmashankar Subramanian, Sola Shirai, Alfio Gliozzo, Debarun Bhattacharjya
cs.AI

Resumo

Text-to-SQL visa traduzir consultas em linguagem natural para instruções SQL, o que é prático, pois permite que qualquer pessoa recupere facilmente as informações desejadas de bancos de dados. Recentemente, muitas abordagens existentes lidam com esse problema utilizando Modelos de Linguagem de Grande Escala (LLMs), aproveitando sua forte capacidade de compreender consultas do usuário e gerar o código SQL correspondente. No entanto, o conhecimento paramétrico dos LLMs pode ser limitado para cobrir todas as consultas diversas e específicas de domínio que exigem ancoragem em vários esquemas de banco de dados, o que torna os SQLs gerados menos precisos em muitos casos. Para resolver isso, propomos a construção de uma base de conhecimento para text-to-SQL, uma fonte fundamental de conhecimento, da qual recuperamos e geramos o conhecimento necessário para consultas específicas. Em particular, diferente das abordagens existentes que ou anotam conhecimento manualmente ou geram apenas algumas partes de conhecimento para cada consulta, nossa base de conhecimento é abrangente, sendo construída com base em uma combinação de todas as perguntas disponíveis e seus esquemas de banco de dados associados, juntamente com o conhecimento relevante, e pode ser reutilizada para bancos de dados não vistos de diferentes conjuntos de dados e domínios. Validamos nossa abordagem em múltiplos conjuntos de dados text-to-SQL, considerando tanto cenários de bancos de dados sobrepostos quanto não sobrepostos, onde ela supera substancialmente as linhas de base relevantes.
English
Text-to-SQL aims to translate natural language queries into SQL statements, which is practical as it enables anyone to easily retrieve the desired information from databases. Recently, many existing approaches tackle this problem with Large Language Models (LLMs), leveraging their strong capability in understanding user queries and generating corresponding SQL code. Yet, the parametric knowledge in LLMs might be limited to covering all the diverse and domain-specific queries that require grounding in various database schemas, which makes generated SQLs less accurate oftentimes. To tackle this, we propose constructing the knowledge base for text-to-SQL, a foundational source of knowledge, from which we retrieve and generate the necessary knowledge for given queries. In particular, unlike existing approaches that either manually annotate knowledge or generate only a few pieces of knowledge for each query, our knowledge base is comprehensive, which is constructed based on a combination of all the available questions and their associated database schemas along with their relevant knowledge, and can be reused for unseen databases from different datasets and domains. We validate our approach on multiple text-to-SQL datasets, considering both the overlapping and non-overlapping database scenarios, where it outperforms relevant baselines substantially.
PDF11December 4, 2025