ChatPaper.aiChatPaper

ST-Raptor: Respostas a Perguntas em Tabelas Semi-Estruturadas com Base em LLM

ST-Raptor: LLM-Powered Semi-Structured Table Question Answering

August 25, 2025
Autores: Zirui Tang, Boyu Niu, Xuanhe Zhou, Boxiu Li, Wei Zhou, Jiannan Wang, Guoliang Li, Xinyi Zhang, Fan Wu
cs.AI

Resumo

Tabelas semiestruturadas, amplamente utilizadas em aplicações do mundo real (por exemplo, relatórios financeiros, registros médicos, ordens transacionais), frequentemente envolvem layouts flexíveis e complexos (por exemplo, cabeçalhos hierárquicos e células mescladas). Essas tabelas geralmente dependem de analistas humanos para interpretar os layouts das tabelas e responder a perguntas relevantes em linguagem natural, o que é custoso e ineficiente. Para automatizar o procedimento, os métodos existentes enfrentam desafios significativos. Primeiro, métodos como NL2SQL exigem a conversão de tabelas semiestruturadas em tabelas estruturadas, o que frequentemente causa uma perda substancial de informação. Segundo, métodos como NL2Code e QA com LLM multimodal lutam para entender os layouts complexos de tabelas semiestruturadas e não conseguem responder com precisão às perguntas correspondentes. Para isso, propomos o ST-Raptor, um framework baseado em árvore para resposta a perguntas em tabelas semiestruturadas usando modelos de linguagem grandes (LLMs). Primeiro, introduzimos a Árvore Hierárquica Ortogonal (HO-Tree), um modelo estrutural que captura layouts complexos de tabelas semiestruturadas, juntamente com um algoritmo eficaz para construir a árvore. Segundo, definimos um conjunto de operações básicas de árvore para orientar os LLMs na execução de tarefas comuns de QA. Dada uma pergunta do usuário, o ST-Raptor a decompõe em subperguntas mais simples, gera pipelines de operações de árvore correspondentes e realiza o alinhamento operação-tabela para uma execução precisa do pipeline. Terceiro, incorporamos um mecanismo de verificação em duas etapas: a validação direta verifica a correção das etapas de execução, enquanto a validação reversa avalia a confiabilidade da resposta reconstruindo consultas a partir das respostas previstas. Para avaliar o desempenho, apresentamos o SSTQA, um conjunto de dados com 764 perguntas sobre 102 tabelas semiestruturadas do mundo real. Os experimentos mostram que o ST-Raptor supera nove baselines em até 20% na precisão das respostas. O código está disponível em https://github.com/weAIDB/ST-Raptor.
English
Semi-structured tables, widely used in real-world applications (e.g., financial reports, medical records, transactional orders), often involve flexible and complex layouts (e.g., hierarchical headers and merged cells). These tables generally rely on human analysts to interpret table layouts and answer relevant natural language questions, which is costly and inefficient. To automate the procedure, existing methods face significant challenges. First, methods like NL2SQL require converting semi-structured tables into structured ones, which often causes substantial information loss. Second, methods like NL2Code and multi-modal LLM QA struggle to understand the complex layouts of semi-structured tables and cannot accurately answer corresponding questions. To this end, we propose ST-Raptor, a tree-based framework for semi-structured table question answering using large language models. First, we introduce the Hierarchical Orthogonal Tree (HO-Tree), a structural model that captures complex semi-structured table layouts, along with an effective algorithm for constructing the tree. Second, we define a set of basic tree operations to guide LLMs in executing common QA tasks. Given a user question, ST-Raptor decomposes it into simpler sub-questions, generates corresponding tree operation pipelines, and conducts operation-table alignment for accurate pipeline execution. Third, we incorporate a two-stage verification mechanism: forward validation checks the correctness of execution steps, while backward validation evaluates answer reliability by reconstructing queries from predicted answers. To benchmark the performance, we present SSTQA, a dataset of 764 questions over 102 real-world semi-structured tables. Experiments show that ST-Raptor outperforms nine baselines by up to 20% in answer accuracy. The code is available at https://github.com/weAIDB/ST-Raptor.
PDF62August 26, 2025