SHARE: Um Assistente Hierárquico de Correção de Ações Baseado em SLM para Texto-para-SQL
SHARE: An SLM-based Hierarchical Action CorREction Assistant for Text-to-SQL
May 31, 2025
Autores: Ge Qu, Jinyang Li, Bowen Qin, Xiaolong Li, Nan Huo, Chenhao Ma, Reynold Cheng
cs.AI
Resumo
As abordagens atuais de autocorreção em text-to-SQL enfrentam duas limitações críticas: 1) Os métodos convencionais de autocorreção dependem de chamadas recursivas de LLMs, resultando em sobrecarga computacional multiplicativa, e 2) Os LLMs têm dificuldade em implementar detecção e correção eficazes de erros para consultas SQL declarativas, pois não conseguem demonstrar o caminho de raciocínio subjacente. Neste trabalho, propomos o SHARE, um assistente de correção hierárquica de ações baseado em SLM que permite que os LLMs realizem localização de erros mais precisa e correção eficiente. O SHARE orquestra três Small Language Models (SLMs) especializados em um pipeline sequencial, onde primeiro transforma consultas SQL declarativas em trajetórias de ações passo a passo que revelam o raciocínio subjacente, seguido por um refinamento granular em duas fases. Além disso, propomos uma nova estratégia hierárquica de auto-evolução para treinamento eficiente em termos de dados. Os resultados experimentais demonstram que o SHARE melhora efetivamente as capacidades de autocorreção, mostrando-se robusto em vários LLMs. Além disso, nossa análise abrangente mostra que o SHARE mantém um desempenho forte mesmo em configurações de treinamento com poucos recursos, o que é particularmente valioso para aplicações text-to-SQL com restrições de privacidade de dados.
English
Current self-correction approaches in text-to-SQL face two critical
limitations: 1) Conventional self-correction methods rely on recursive
self-calls of LLMs, resulting in multiplicative computational overhead, and 2)
LLMs struggle to implement effective error detection and correction for
declarative SQL queries, as they fail to demonstrate the underlying reasoning
path. In this work, we propose SHARE, an SLM-based Hierarchical Action
corREction assistant that enables LLMs to perform more precise error
localization and efficient correction. SHARE orchestrates three specialized
Small Language Models (SLMs) in a sequential pipeline, where it first
transforms declarative SQL queries into stepwise action trajectories that
reveal underlying reasoning, followed by a two-phase granular refinement. We
further propose a novel hierarchical self-evolution strategy for data-efficient
training. Experimental results demonstrate that SHARE effectively enhances
self-correction capabilities while proving robust across various LLMs.
Furthermore, our comprehensive analysis shows that SHARE maintains strong
performance even in low-resource training settings, which is particularly
valuable for text-to-SQL applications with data privacy constraints.