ChatPaper.aiChatPaper

RoundTable: Sfruttare Schema Dinamico e Autocompletamento Contestuale per Migliorare la Precisione delle Query nel Question Answering su Tabelle

RoundTable: Leveraging Dynamic Schema and Contextual Autocomplete for Enhanced Query Precision in Tabular Question Answering

August 22, 2024
Autori: Pratyush Kumar, Kuber Vijaykumar Bellad, Bharat Vadlamudi, Aman Chadha
cs.AI

Abstract

Con i progressi nei Modelli Linguistici di Grande Dimensione (LLM), un caso d'uso significativo che è emerso è l'interrogazione di database in linguaggio naturale, traducendo le domande degli utenti in query eseguibili, il che ha visto un notevole miglioramento. Tuttavia, i dataset del mondo reale presentano spesso una vasta gamma di attributi e valori complessi, complicando il compito degli LLM di identificare con precisione colonne o valori rilevanti dalle query in linguaggio naturale. I metodi tradizionali non riescono a comunicare appieno la dimensione e la complessità dei dataset agli LLM. Per affrontare queste sfide, proponiamo un nuovo framework che sfrutta la Ricerca Full-Text (FTS) sulla tabella di input. Questo approccio non solo consente una rilevazione precisa di valori e colonne specifici, ma riduce anche lo spazio di ricerca per i modelli linguistici, migliorando così l'accuratezza delle query. Inoltre, supporta una funzionalità personalizzata di auto-completamento che suggerisce query basate sui dati presenti nella tabella. Questa integrazione affina significativamente l'interazione tra l'utente e i dataset complessi, offrendo una soluzione sofisticata ai limiti delle attuali capacità di interrogazione delle tabelle. Questo lavoro è accompagnato da un'applicazione per le piattaforme Mac e Windows, che i lettori possono provare direttamente sui propri dati.
English
With advancements in Large Language Models (LLMs), a major use case that has emerged is querying databases in plain English, translating user questions into executable database queries, which has improved significantly. However, real-world datasets often feature a vast array of attributes and complex values, complicating the LLMs task of accurately identifying relevant columns or values from natural language queries. Traditional methods cannot fully relay the datasets size and complexity to the LLM. To address these challenges, we propose a novel framework that leverages Full-Text Search (FTS) on the input table. This approach not only enables precise detection of specific values and columns but also narrows the search space for language models, thereby enhancing query accuracy. Additionally, it supports a custom auto-complete feature that suggests queries based on the data in the table. This integration significantly refines the interaction between the user and complex datasets, offering a sophisticated solution to the limitations faced by current table querying capabilities. This work is accompanied by an application for both Mac and Windows platforms, which readers can try out themselves on their own data.
PDF51November 16, 2024