Recherche approfondie sur les données tabulaires via une exécution continue pilotée par l'expérience

Résumé

Les grands modèles linguistiques éprouvent souvent des difficultés avec les tâches analytiques complexes à long terme sur des tables non structurées, qui présentent généralement des en-têtes hiérarchiques bidirectionnels et des mises en page non canoniques. Nous formalisons ce défi sous le nom de Recherche Tabulaire Profonde (RTP), qui nécessite un raisonnement multi-étapes sur des régions tabulaires interdépendantes. Pour relever ce défi, nous proposons un nouveau cadre agentique qui traite le raisonnement tabulaire comme un processus décisionnel en boucle fermée. Nous concevons soigneusement une compréhension couplée requête-table pour la prise de décision de cheminement et l'exécution opérationnelle. Plus précisément, (i) la RTP construit d'abord un méta-graphe hiérarchique pour capturer la sémantique bidirectionnelle, en mappant les requêtes en langage naturel dans un espace de recherche au niveau opérationnel ; (ii) Pour naviguer dans cet espace, nous introduisons une politique de sélection sensible aux attentes qui priorise les chemins d'exécision à forte utilité ; (iii) De manière cruciale, les résultats d'exécution historiques sont synthétisés dans une mémoire structurée siamois, c'est-à-dire des mises à jour paramétrées et des textes abstraits, permettant un raffinement continu. Des expériences approfondies sur des benchmarks tabulaires non structurés exigeants vérifient l'efficacité de notre approche et soulignent la nécessité de séparer la planification stratégique de l'exécution opérationnelle pour le raisonnement tabulaire à long terme.

English

Large language models often struggle with complex long-horizon analytical tasks over unstructured tables, which typically feature hierarchical and bidirectional headers and non-canonical layouts. We formalize this challenge as Deep Tabular Research (DTR), requiring multi-step reasoning over interdependent table regions. To address DTR, we propose a novel agentic framework that treats tabular reasoning as a closed-loop decision-making process. We carefully design a coupled query and table comprehension for path decision making and operational execution. Specifically, (i) DTR first constructs a hierarchical meta graph to capture bidirectional semantics, mapping natural language queries into an operation-level search space; (ii) To navigate this space, we introduce an expectation-aware selection policy that prioritizes high-utility execution paths; (iii) Crucially, historical execution outcomes are synthesized into a siamese structured memory, i.e., parameterized updates and abstracted texts, enabling continual refinement. Extensive experiments on challenging unstructured tabular benchmarks verify the effectiveness and highlight the necessity of separating strategic planning from low-level execution for long-horizon tabular reasoning.

Recherche approfondie sur les données tabulaires via une exécution continue pilotée par l'expérience

Deep Tabular Research via Continual Experience-Driven Execution

Résumé

Support