SHARE: Un Assistente Gerarchico per la Correzione delle Azioni basato su SLM per Text-to-SQL
SHARE: An SLM-based Hierarchical Action CorREction Assistant for Text-to-SQL
May 31, 2025
Autori: Ge Qu, Jinyang Li, Bowen Qin, Xiaolong Li, Nan Huo, Chenhao Ma, Reynold Cheng
cs.AI
Abstract
Gli attuali approcci di autocorrezione nel campo di text-to-SQL affrontano due limitazioni critiche: 1) I metodi convenzionali di autocorrezione si basano su chiamate ricorsive di LLM, con conseguente sovraccarico computazionale moltiplicativo, e 2) Gli LLM faticano a implementare un rilevamento e una correzione efficaci degli errori per query SQL dichiarative, poiché non riescono a dimostrare il percorso di ragionamento sottostante. In questo lavoro, proponiamo SHARE, un assistente di correzione gerarchica basato su SLM (Small Language Model) che consente agli LLM di eseguire una localizzazione degli errori più precisa e una correzione efficiente. SHARE orchestra tre Small Language Model (SLM) specializzati in una pipeline sequenziale, in cui prima trasforma le query SQL dichiarative in traiettorie di azioni passo-passo che rivelano il ragionamento sottostante, seguito da un affinamento granulare in due fasi. Proponiamo inoltre una nuova strategia di auto-evoluzione gerarchica per un addestramento efficiente in termini di dati. I risultati sperimentali dimostrano che SHARE migliora efficacemente le capacità di autocorrezione, dimostrandosi robusto su vari LLM. Inoltre, la nostra analisi completa mostra che SHARE mantiene prestazioni solide anche in contesti di addestramento con risorse limitate, il che è particolarmente prezioso per applicazioni text-to-SQL con vincoli di privacy dei dati.
English
Current self-correction approaches in text-to-SQL face two critical
limitations: 1) Conventional self-correction methods rely on recursive
self-calls of LLMs, resulting in multiplicative computational overhead, and 2)
LLMs struggle to implement effective error detection and correction for
declarative SQL queries, as they fail to demonstrate the underlying reasoning
path. In this work, we propose SHARE, an SLM-based Hierarchical Action
corREction assistant that enables LLMs to perform more precise error
localization and efficient correction. SHARE orchestrates three specialized
Small Language Models (SLMs) in a sequential pipeline, where it first
transforms declarative SQL queries into stepwise action trajectories that
reveal underlying reasoning, followed by a two-phase granular refinement. We
further propose a novel hierarchical self-evolution strategy for data-efficient
training. Experimental results demonstrate that SHARE effectively enhances
self-correction capabilities while proving robust across various LLMs.
Furthermore, our comprehensive analysis shows that SHARE maintains strong
performance even in low-resource training settings, which is particularly
valuable for text-to-SQL applications with data privacy constraints.