ChatPaper.aiChatPaper

ST-Raptor: Respuesta a Preguntas en Tablas Semi-Estructuradas Basada en Modelos de Lenguaje de Gran Escala

ST-Raptor: LLM-Powered Semi-Structured Table Question Answering

August 25, 2025
Autores: Zirui Tang, Boyu Niu, Xuanhe Zhou, Boxiu Li, Wei Zhou, Jiannan Wang, Guoliang Li, Xinyi Zhang, Fan Wu
cs.AI

Resumen

Las tablas semiestructuradas, ampliamente utilizadas en aplicaciones del mundo real (por ejemplo, informes financieros, registros médicos, órdenes transaccionales), suelen involucrar diseños flexibles y complejos (por ejemplo, encabezados jerárquicos y celdas fusionadas). Estas tablas generalmente dependen de analistas humanos para interpretar los diseños de las tablas y responder a preguntas relevantes en lenguaje natural, lo cual es costoso e ineficiente. Para automatizar este procedimiento, los métodos existentes enfrentan desafíos significativos. En primer lugar, métodos como NL2SQL requieren convertir tablas semiestructuradas en estructuradas, lo que a menudo provoca una pérdida sustancial de información. En segundo lugar, métodos como NL2Code y QA multimodal con LLM tienen dificultades para comprender los diseños complejos de las tablas semiestructuradas y no pueden responder con precisión a las preguntas correspondientes. Con este fin, proponemos ST-Raptor, un marco basado en árboles para la respuesta a preguntas sobre tablas semiestructuradas utilizando modelos de lenguaje grandes (LLM). En primer lugar, introducimos el Árbol Ortogonal Jerárquico (HO-Tree), un modelo estructural que captura los diseños complejos de las tablas semiestructuradas, junto con un algoritmo eficaz para construir el árbol. En segundo lugar, definimos un conjunto de operaciones básicas de árbol para guiar a los LLM en la ejecución de tareas comunes de QA. Dada una pregunta del usuario, ST-Raptor la descompone en subpreguntas más simples, genera las correspondientes tuberías de operaciones de árbol y realiza una alineación operación-tabla para una ejecución precisa de la tubería. En tercer lugar, incorporamos un mecanismo de verificación en dos etapas: la validación hacia adelante verifica la corrección de los pasos de ejecución, mientras que la validación hacia atrás evalúa la confiabilidad de las respuestas reconstruyendo consultas a partir de las respuestas predichas. Para evaluar el rendimiento, presentamos SSTQA, un conjunto de datos de 764 preguntas sobre 102 tablas semiestructuradas del mundo real. Los experimentos muestran que ST-Raptor supera a nueve líneas base en hasta un 20% en precisión de respuestas. El código está disponible en https://github.com/weAIDB/ST-Raptor.
English
Semi-structured tables, widely used in real-world applications (e.g., financial reports, medical records, transactional orders), often involve flexible and complex layouts (e.g., hierarchical headers and merged cells). These tables generally rely on human analysts to interpret table layouts and answer relevant natural language questions, which is costly and inefficient. To automate the procedure, existing methods face significant challenges. First, methods like NL2SQL require converting semi-structured tables into structured ones, which often causes substantial information loss. Second, methods like NL2Code and multi-modal LLM QA struggle to understand the complex layouts of semi-structured tables and cannot accurately answer corresponding questions. To this end, we propose ST-Raptor, a tree-based framework for semi-structured table question answering using large language models. First, we introduce the Hierarchical Orthogonal Tree (HO-Tree), a structural model that captures complex semi-structured table layouts, along with an effective algorithm for constructing the tree. Second, we define a set of basic tree operations to guide LLMs in executing common QA tasks. Given a user question, ST-Raptor decomposes it into simpler sub-questions, generates corresponding tree operation pipelines, and conducts operation-table alignment for accurate pipeline execution. Third, we incorporate a two-stage verification mechanism: forward validation checks the correctness of execution steps, while backward validation evaluates answer reliability by reconstructing queries from predicted answers. To benchmark the performance, we present SSTQA, a dataset of 764 questions over 102 real-world semi-structured tables. Experiments show that ST-Raptor outperforms nine baselines by up to 20% in answer accuracy. The code is available at https://github.com/weAIDB/ST-Raptor.
PDF11August 26, 2025