SHARE : Un Assistant Hiérarchique de Correction d'Actions basé sur SLM pour Text-to-SQL

papers.abstract

Les approches actuelles d'auto-correction dans le domaine text-to-SQL rencontrent deux limitations critiques : 1) Les méthodes conventionnelles d'auto-correction reposent sur des appels récursifs de LLMs (Large Language Models), entraînant une surcharge computationnelle multiplicative, et 2) Les LLMs peinent à mettre en œuvre une détection et une correction efficaces des erreurs pour les requêtes SQL déclaratives, car ils ne parviennent pas à démontrer le chemin de raisonnement sous-jacent. Dans ce travail, nous proposons SHARE, un assistant de correction hiérarchique basé sur des SLMs (Small Language Models) qui permet aux LLMs de réaliser une localisation des erreurs plus précise et une correction plus efficace. SHARE orchestre trois SLMs spécialisés dans un pipeline séquentiel, où il transforme d'abord les requêtes SQL déclaratives en trajectoires d'actions étape par étape révélant le raisonnement sous-jacent, suivi d'un affinement granulaire en deux phases. Nous proposons également une nouvelle stratégie hiérarchique d'auto-évolution pour un entraînement efficace en termes de données. Les résultats expérimentaux démontrent que SHARE améliore efficacement les capacités d'auto-correction tout en se montrant robuste avec divers LLMs. De plus, notre analyse approfondie montre que SHARE maintient des performances solides même dans des contextes d'entraînement à faibles ressources, ce qui est particulièrement précieux pour les applications text-to-SQL soumises à des contraintes de confidentialité des données.

English

Current self-correction approaches in text-to-SQL face two critical limitations: 1) Conventional self-correction methods rely on recursive self-calls of LLMs, resulting in multiplicative computational overhead, and 2) LLMs struggle to implement effective error detection and correction for declarative SQL queries, as they fail to demonstrate the underlying reasoning path. In this work, we propose SHARE, an SLM-based Hierarchical Action corREction assistant that enables LLMs to perform more precise error localization and efficient correction. SHARE orchestrates three specialized Small Language Models (SLMs) in a sequential pipeline, where it first transforms declarative SQL queries into stepwise action trajectories that reveal underlying reasoning, followed by a two-phase granular refinement. We further propose a novel hierarchical self-evolution strategy for data-efficient training. Experimental results demonstrate that SHARE effectively enhances self-correction capabilities while proving robust across various LLMs. Furthermore, our comprehensive analysis shows that SHARE maintains strong performance even in low-resource training settings, which is particularly valuable for text-to-SQL applications with data privacy constraints.

SHARE : Un Assistant Hiérarchique de Correction d'Actions basé sur SLM pour Text-to-SQL

SHARE: An SLM-based Hierarchical Action CorREction Assistant for Text-to-SQL

papers.abstract

Support