SHARE : Un Assistant Hiérarchique de Correction d'Actions basé sur SLM pour Text-to-SQL
SHARE: An SLM-based Hierarchical Action CorREction Assistant for Text-to-SQL
May 31, 2025
Auteurs: Ge Qu, Jinyang Li, Bowen Qin, Xiaolong Li, Nan Huo, Chenhao Ma, Reynold Cheng
cs.AI
Résumé
Les approches actuelles d'auto-correction dans le domaine text-to-SQL rencontrent deux limitations critiques : 1) Les méthodes conventionnelles d'auto-correction reposent sur des appels récursifs de LLMs (Large Language Models), entraînant une surcharge computationnelle multiplicative, et 2) Les LLMs peinent à mettre en œuvre une détection et une correction efficaces des erreurs pour les requêtes SQL déclaratives, car ils ne parviennent pas à démontrer le chemin de raisonnement sous-jacent. Dans ce travail, nous proposons SHARE, un assistant de correction hiérarchique basé sur des SLMs (Small Language Models) qui permet aux LLMs de réaliser une localisation des erreurs plus précise et une correction plus efficace. SHARE orchestre trois SLMs spécialisés dans un pipeline séquentiel, où il transforme d'abord les requêtes SQL déclaratives en trajectoires d'actions étape par étape révélant le raisonnement sous-jacent, suivi d'un affinement granulaire en deux phases. Nous proposons également une nouvelle stratégie hiérarchique d'auto-évolution pour un entraînement efficace en termes de données. Les résultats expérimentaux démontrent que SHARE améliore efficacement les capacités d'auto-correction tout en se montrant robuste avec divers LLMs. De plus, notre analyse approfondie montre que SHARE maintient des performances solides même dans des contextes d'entraînement à faibles ressources, ce qui est particulièrement précieux pour les applications text-to-SQL soumises à des contraintes de confidentialité des données.
English
Current self-correction approaches in text-to-SQL face two critical
limitations: 1) Conventional self-correction methods rely on recursive
self-calls of LLMs, resulting in multiplicative computational overhead, and 2)
LLMs struggle to implement effective error detection and correction for
declarative SQL queries, as they fail to demonstrate the underlying reasoning
path. In this work, we propose SHARE, an SLM-based Hierarchical Action
corREction assistant that enables LLMs to perform more precise error
localization and efficient correction. SHARE orchestrates three specialized
Small Language Models (SLMs) in a sequential pipeline, where it first
transforms declarative SQL queries into stepwise action trajectories that
reveal underlying reasoning, followed by a two-phase granular refinement. We
further propose a novel hierarchical self-evolution strategy for data-efficient
training. Experimental results demonstrate that SHARE effectively enhances
self-correction capabilities while proving robust across various LLMs.
Furthermore, our comprehensive analysis shows that SHARE maintains strong
performance even in low-resource training settings, which is particularly
valuable for text-to-SQL applications with data privacy constraints.