Mesa Redonda: Alavancando Esquema Dinâmico e Autocompletar Contextual para Aumentar a Precisão da Consulta em Perguntas e Respostas Tabulares
RoundTable: Leveraging Dynamic Schema and Contextual Autocomplete for Enhanced Query Precision in Tabular Question Answering
August 22, 2024
Autores: Pratyush Kumar, Kuber Vijaykumar Bellad, Bharat Vadlamudi, Aman Chadha
cs.AI
Resumo
Com os avanços em Modelos de Linguagem de Grande Escala (LLMs), um importante caso de uso que surgiu é a consulta a bancos de dados em inglês simples, traduzindo perguntas de usuários em consultas de banco de dados executáveis, o que melhorou significativamente. No entanto, conjuntos de dados do mundo real frequentemente apresentam uma vasta gama de atributos e valores complexos, complicando a tarefa dos LLMs de identificar com precisão colunas ou valores relevantes a partir de consultas em linguagem natural. Métodos tradicionais não conseguem transmitir totalmente o tamanho e a complexidade dos conjuntos de dados para o LLM. Para enfrentar esses desafios, propomos um novo framework que aproveita a Pesquisa de Texto Completo (FTS) na tabela de entrada. Esta abordagem não apenas permite a detecção precisa de valores e colunas específicos, mas também reduz o espaço de busca para os modelos de linguagem, melhorando assim a precisão da consulta. Além disso, suporta um recurso de auto-completar personalizado que sugere consultas com base nos dados na tabela. Essa integração refina significativamente a interação entre o usuário e conjuntos de dados complexos, oferecendo uma solução sofisticada para as limitações enfrentadas pelas capacidades atuais de consulta de tabelas. Este trabalho é acompanhado por um aplicativo para plataformas Mac e Windows, que os leitores podem experimentar por si mesmos com seus próprios dados.
English
With advancements in Large Language Models (LLMs), a major use case that has
emerged is querying databases in plain English, translating user questions into
executable database queries, which has improved significantly. However,
real-world datasets often feature a vast array of attributes and complex
values, complicating the LLMs task of accurately identifying relevant columns
or values from natural language queries. Traditional methods cannot fully relay
the datasets size and complexity to the LLM. To address these challenges, we
propose a novel framework that leverages Full-Text Search (FTS) on the input
table. This approach not only enables precise detection of specific values and
columns but also narrows the search space for language models, thereby
enhancing query accuracy. Additionally, it supports a custom auto-complete
feature that suggests queries based on the data in the table. This integration
significantly refines the interaction between the user and complex datasets,
offering a sophisticated solution to the limitations faced by current table
querying capabilities. This work is accompanied by an application for both Mac
and Windows platforms, which readers can try out themselves on their own data.Summary
AI-Generated Summary