SHARE: Un Asistente Jerárquico de Corrección de Acciones basado en SLM para Texto-a-SQL
SHARE: An SLM-based Hierarchical Action CorREction Assistant for Text-to-SQL
May 31, 2025
Autores: Ge Qu, Jinyang Li, Bowen Qin, Xiaolong Li, Nan Huo, Chenhao Ma, Reynold Cheng
cs.AI
Resumen
Los enfoques actuales de autocorrección en text-to-SQL enfrentan dos limitaciones críticas: 1) Los métodos convencionales de autocorrección dependen de llamadas recursivas a LLMs, lo que resulta en un sobrecosto computacional multiplicativo, y 2) Los LLMs tienen dificultades para implementar una detección y corrección efectiva de errores en consultas SQL declarativas, ya que no logran demostrar el razonamiento subyacente. En este trabajo, proponemos SHARE, un asistente de corrección jerárquica basado en SLM que permite a los LLMs realizar una localización de errores más precisa y una corrección eficiente. SHARE orquesta tres Pequeños Modelos de Lenguaje (SLMs) especializados en una secuencia de pasos, donde primero transforma las consultas SQL declarativas en trayectorias de acciones paso a paso que revelan el razonamiento subyacente, seguido de un refinamiento granular en dos fases. Además, proponemos una novedosa estrategia de autoevolución jerárquica para un entrenamiento eficiente en términos de datos. Los resultados experimentales demuestran que SHARE mejora efectivamente las capacidades de autocorrección y se muestra robusto en diversos LLMs. Además, nuestro análisis exhaustivo muestra que SHARE mantiene un rendimiento sólido incluso en entornos de entrenamiento con recursos limitados, lo cual es particularmente valioso para aplicaciones de text-to-SQL con restricciones de privacidad de datos.
English
Current self-correction approaches in text-to-SQL face two critical
limitations: 1) Conventional self-correction methods rely on recursive
self-calls of LLMs, resulting in multiplicative computational overhead, and 2)
LLMs struggle to implement effective error detection and correction for
declarative SQL queries, as they fail to demonstrate the underlying reasoning
path. In this work, we propose SHARE, an SLM-based Hierarchical Action
corREction assistant that enables LLMs to perform more precise error
localization and efficient correction. SHARE orchestrates three specialized
Small Language Models (SLMs) in a sequential pipeline, where it first
transforms declarative SQL queries into stepwise action trajectories that
reveal underlying reasoning, followed by a two-phase granular refinement. We
further propose a novel hierarchical self-evolution strategy for data-efficient
training. Experimental results demonstrate that SHARE effectively enhances
self-correction capabilities while proving robust across various LLMs.
Furthermore, our comprehensive analysis shows that SHARE maintains strong
performance even in low-resource training settings, which is particularly
valuable for text-to-SQL applications with data privacy constraints.