Pesquisa em Dados Tabulares Profunda por Meio de Execução Orientada por Experiência Contínua

Resumo

Os grandes modelos de linguagem frequentemente apresentam dificuldades com tarefas analíticas complexas de longo horizonte sobre tabelas não estruturadas, que tipicamente possuem cabeçalhos hierárquicos e bidirecionais com layouts não canônicos. Formalizamos este desafio como Pesquisa Tabulária Profunda (DTR), que requer raciocínio multi-etapas sobre regiões tabulares interdependentes. Para abordar a DTR, propomos uma nova estrutura agentiva que trata o raciocínio tabular como um processo decisório de ciclo fechado. Projetamos cuidadosamente uma compreensão acoplada de consulta e tabela para tomada de decisão de caminho e execução operacional. Especificamente: (i) a DTR primeiro constrói um meta-grafo hierárquico para capturar semânticas bidirecionais, mapeando consultas de linguagem natural em um espaço de busca a nível operacional; (ii) Para navegar neste espaço, introduzimos uma política de seleção consciente da expectativa que prioriza caminhos de execução de alta utilidade; (iii) Crucialmente, os resultados históricos de execução são sintetizados em uma memória estruturada siamesa, ou seja, atualizações parametrizadas e textos abstraídos, permitindo um refinamento contínuo. Experimentos extensos em benchmarks desafiadores de tabelas não estruturadas verificam a eficácia e destacam a necessidade de separar o planejamento estratégico da execução de baixo nível para o raciocínio tabular de longo horizonte.

English

Large language models often struggle with complex long-horizon analytical tasks over unstructured tables, which typically feature hierarchical and bidirectional headers and non-canonical layouts. We formalize this challenge as Deep Tabular Research (DTR), requiring multi-step reasoning over interdependent table regions. To address DTR, we propose a novel agentic framework that treats tabular reasoning as a closed-loop decision-making process. We carefully design a coupled query and table comprehension for path decision making and operational execution. Specifically, (i) DTR first constructs a hierarchical meta graph to capture bidirectional semantics, mapping natural language queries into an operation-level search space; (ii) To navigate this space, we introduce an expectation-aware selection policy that prioritizes high-utility execution paths; (iii) Crucially, historical execution outcomes are synthesized into a siamese structured memory, i.e., parameterized updates and abstracted texts, enabling continual refinement. Extensive experiments on challenging unstructured tabular benchmarks verify the effectiveness and highlight the necessity of separating strategic planning from low-level execution for long-horizon tabular reasoning.

Pesquisa em Dados Tabulares Profunda por Meio de Execução Orientada por Experiência Contínua

Deep Tabular Research via Continual Experience-Driven Execution

Resumo

Support