ChatPaper.aiChatPaper

SHARE: テキストからSQLへの階層的アクション修正アシスタント - SLMベースのアプローチ

SHARE: An SLM-based Hierarchical Action CorREction Assistant for Text-to-SQL

May 31, 2025
著者: Ge Qu, Jinyang Li, Bowen Qin, Xiaolong Li, Nan Huo, Chenhao Ma, Reynold Cheng
cs.AI

要旨

現在のテキスト-to-SQLにおける自己修正アプローチは、2つの重要な課題に直面しています。1) 従来の自己修正手法は、大規模言語モデル(LLMs)の再帰的な自己呼び出しに依存しており、計算オーバーヘッドが乗算的に増大する問題があります。2) LLMsは、宣言型SQLクエリに対する効果的なエラー検出と修正を実装するのに苦労しており、その根底にある推論パスを明示することができません。本研究では、SHARE(SLM-based Hierarchical Action corREction assistant)を提案します。これは、LLMsがより正確なエラー位置特定と効率的な修正を可能にする階層型アクション修正アシスタントです。SHAREは、3つの専門化された小型言語モデル(SLMs)を順次パイプラインで編成し、まず宣言型SQLクエリを段階的なアクション軌跡に変換して根底の推論を明らかにし、その後2段階の粒度の細かい修正を行います。さらに、データ効率的なトレーニングのための新しい階層型自己進化戦略を提案します。実験結果は、SHAREが自己修正能力を効果的に向上させ、さまざまなLLMsにおいて堅牢性を証明することを示しています。さらに、詳細な分析により、SHAREは低リソースのトレーニング設定においても強力な性能を維持し、データプライバシー制約のあるテキスト-to-SQLアプリケーションにとって特に価値があることが明らかになりました。
English
Current self-correction approaches in text-to-SQL face two critical limitations: 1) Conventional self-correction methods rely on recursive self-calls of LLMs, resulting in multiplicative computational overhead, and 2) LLMs struggle to implement effective error detection and correction for declarative SQL queries, as they fail to demonstrate the underlying reasoning path. In this work, we propose SHARE, an SLM-based Hierarchical Action corREction assistant that enables LLMs to perform more precise error localization and efficient correction. SHARE orchestrates three specialized Small Language Models (SLMs) in a sequential pipeline, where it first transforms declarative SQL queries into stepwise action trajectories that reveal underlying reasoning, followed by a two-phase granular refinement. We further propose a novel hierarchical self-evolution strategy for data-efficient training. Experimental results demonstrate that SHARE effectively enhances self-correction capabilities while proving robust across various LLMs. Furthermore, our comprehensive analysis shows that SHARE maintains strong performance even in low-resource training settings, which is particularly valuable for text-to-SQL applications with data privacy constraints.
PDF32June 4, 2025