SHARE: Un Assistente Gerarchico per la Correzione delle Azioni basato su SLM per Text-to-SQL

Abstract

Gli attuali approcci di autocorrezione nel campo di text-to-SQL affrontano due limitazioni critiche: 1) I metodi convenzionali di autocorrezione si basano su chiamate ricorsive di LLM, con conseguente sovraccarico computazionale moltiplicativo, e 2) Gli LLM faticano a implementare un rilevamento e una correzione efficaci degli errori per query SQL dichiarative, poiché non riescono a dimostrare il percorso di ragionamento sottostante. In questo lavoro, proponiamo SHARE, un assistente di correzione gerarchica basato su SLM (Small Language Model) che consente agli LLM di eseguire una localizzazione degli errori più precisa e una correzione efficiente. SHARE orchestra tre Small Language Model (SLM) specializzati in una pipeline sequenziale, in cui prima trasforma le query SQL dichiarative in traiettorie di azioni passo-passo che rivelano il ragionamento sottostante, seguito da un affinamento granulare in due fasi. Proponiamo inoltre una nuova strategia di auto-evoluzione gerarchica per un addestramento efficiente in termini di dati. I risultati sperimentali dimostrano che SHARE migliora efficacemente le capacità di autocorrezione, dimostrandosi robusto su vari LLM. Inoltre, la nostra analisi completa mostra che SHARE mantiene prestazioni solide anche in contesti di addestramento con risorse limitate, il che è particolarmente prezioso per applicazioni text-to-SQL con vincoli di privacy dei dati.

English

Current self-correction approaches in text-to-SQL face two critical limitations: 1) Conventional self-correction methods rely on recursive self-calls of LLMs, resulting in multiplicative computational overhead, and 2) LLMs struggle to implement effective error detection and correction for declarative SQL queries, as they fail to demonstrate the underlying reasoning path. In this work, we propose SHARE, an SLM-based Hierarchical Action corREction assistant that enables LLMs to perform more precise error localization and efficient correction. SHARE orchestrates three specialized Small Language Models (SLMs) in a sequential pipeline, where it first transforms declarative SQL queries into stepwise action trajectories that reveal underlying reasoning, followed by a two-phase granular refinement. We further propose a novel hierarchical self-evolution strategy for data-efficient training. Experimental results demonstrate that SHARE effectively enhances self-correction capabilities while proving robust across various LLMs. Furthermore, our comprehensive analysis shows that SHARE maintains strong performance even in low-resource training settings, which is particularly valuable for text-to-SQL applications with data privacy constraints.

SHARE: Un Assistente Gerarchico per la Correzione delle Azioni basato su SLM per Text-to-SQL

SHARE: An SLM-based Hierarchical Action CorREction Assistant for Text-to-SQL

Abstract

Support