TabDSR: Zerlegen, Bereinigen und Schließen für komplexes numerisches Schließen in tabellendaten

papers.abstract

Komplexes Schließen über tabellarischen Daten ist entscheidend für die Datenanalyse in der Praxis, doch große Sprachmodelle (LLMs) liefern bei komplexen Abfragen, verrauschten Daten und begrenzten numerischen Fähigkeiten oft unzureichende Ergebnisse. Um diese Probleme zu adressieren, schlagen wir \method vor, ein Framework bestehend aus: (1) einem Abfragezerleger, der komplexe Fragen aufschlüsselt, (2) einem Tabellenbereiniger, der verrauschte Tabellen bereinigt und filtert, und (3) einem Program-of-Thoughts (PoT)-basierten Reasoner, der ausführbaren Code generiert, um die endgültige Antwort aus der bereinigten Tabelle abzuleiten. Um eine verzerrte Evaluation zu vermeiden und Datenlecks zu minimieren, führen wir einen neuen Datensatz, CalTab151, ein, der speziell für komplexes numerisches Schließen über Tabellen entwickelt wurde. Experimentelle Ergebnisse zeigen, dass \method bestehende Methoden konsistent übertrifft und state-of-the-art (SOTA)-Leistung mit Genauigkeitssteigerungen von 8,79 %, 6,08 % bzw. 19,87 % auf TAT-QA, TableBench und \method erzielt. Darüber hinaus integriert sich unser Framework nahtlos in gängige LLMs und bietet so eine robuste Lösung für komplexes tabellarisches numerisches Schließen. Diese Ergebnisse unterstreichen die Wirksamkeit unseres Frameworks zur Verbesserung der LLM-Leistung bei komplexem tabellarischen numerischen Schließen. Daten und Code sind auf Anfrage erhältlich.

English

Complex reasoning over tabular data is crucial in real-world data analysis, yet large language models (LLMs) often underperform due to complex queries, noisy data, and limited numerical capabilities. To address these issues, we propose \method, a framework consisting of: (1) a query decomposer that breaks down complex questions, (2) a table sanitizer that cleans and filters noisy tables, and (3) a program-of-thoughts (PoT)-based reasoner that generates executable code to derive the final answer from the sanitized table. To ensure unbiased evaluation and mitigate data leakage, we introduce a new dataset, CalTab151, specifically designed for complex numerical reasoning over tables. Experimental results demonstrate that \method consistently outperforms existing methods, achieving state-of-the-art (SOTA) performance with 8.79%, 6.08%, and 19.87% accuracy improvement on TAT-QA, TableBench, and \method, respectively. Moreover, our framework integrates seamlessly with mainstream LLMs, providing a robust solution for complex tabular numerical reasoning. These findings highlight the effectiveness of our framework in enhancing LLM performance for complex tabular numerical reasoning. Data and code are available upon request.

TabDSR: Zerlegen, Bereinigen und Schließen für komplexes numerisches Schließen in tabellendaten

TabDSR: Decompose, Sanitize, and Reason for Complex Numerical Reasoning in Tabular Data

papers.abstract

Support