SHARE: Een op SLM gebaseerde hiërarchische actiecorrectie-assistent voor Text-to-SQL
SHARE: An SLM-based Hierarchical Action CorREction Assistant for Text-to-SQL
May 31, 2025
Auteurs: Ge Qu, Jinyang Li, Bowen Qin, Xiaolong Li, Nan Huo, Chenhao Ma, Reynold Cheng
cs.AI
Samenvatting
Huidige zelfcorrectiebenaderingen in text-to-SQL kampen met twee kritieke beperkingen: 1) Conventionele zelfcorrectiemethoden vertrouwen op recursieve zelfaanroepen van LLM's, wat resulteert in een vermenigvuldigende rekenkundige overhead, en 2) LLM's hebben moeite met het implementeren van effectieve foutdetectie en -correctie voor declaratieve SQL-query's, omdat ze niet in staat zijn het onderliggende redeneerpad te demonstreren. In dit werk stellen we SHARE voor, een SLM-gebaseerde Hierarchical Action corREction-assistent die LLM's in staat stelt om nauwkeurigere foutlokalisatie en efficiëntere correctie uit te voeren. SHARE coördineert drie gespecialiseerde Small Language Models (SLM's) in een sequentiële pijplijn, waarbij het eerst declaratieve SQL-query's omzet in stapsgewijze actietrajecten die het onderliggende redeneerproces onthullen, gevolgd door een tweefasige granulair verfijning. We stellen verder een nieuwe hiërarchische zelfevolutiestrategie voor voor data-efficiënte training. Experimentele resultaten tonen aan dat SHARE de zelfcorrectiecapaciteiten effectief verbetert en robuust blijkt over verschillende LLM's. Bovendien toont onze uitgebreide analyse aan dat SHARE sterke prestaties behoudt, zelfs in trainingsomgevingen met beperkte middelen, wat bijzonder waardevol is voor text-to-SQL-toepassingen met beperkingen op het gebied van gegevensprivacy.
English
Current self-correction approaches in text-to-SQL face two critical
limitations: 1) Conventional self-correction methods rely on recursive
self-calls of LLMs, resulting in multiplicative computational overhead, and 2)
LLMs struggle to implement effective error detection and correction for
declarative SQL queries, as they fail to demonstrate the underlying reasoning
path. In this work, we propose SHARE, an SLM-based Hierarchical Action
corREction assistant that enables LLMs to perform more precise error
localization and efficient correction. SHARE orchestrates three specialized
Small Language Models (SLMs) in a sequential pipeline, where it first
transforms declarative SQL queries into stepwise action trajectories that
reveal underlying reasoning, followed by a two-phase granular refinement. We
further propose a novel hierarchical self-evolution strategy for data-efficient
training. Experimental results demonstrate that SHARE effectively enhances
self-correction capabilities while proving robust across various LLMs.
Furthermore, our comprehensive analysis shows that SHARE maintains strong
performance even in low-resource training settings, which is particularly
valuable for text-to-SQL applications with data privacy constraints.