ChatPaper.aiChatPaper

SHARE: 텍스트-to-SQL을 위한 SLM 기반 계층적 액션 보정 어시스턴트

SHARE: An SLM-based Hierarchical Action CorREction Assistant for Text-to-SQL

May 31, 2025
저자: Ge Qu, Jinyang Li, Bowen Qin, Xiaolong Li, Nan Huo, Chenhao Ma, Reynold Cheng
cs.AI

초록

현재 텍스트-to-SQL 분야의 자기 수정 접근법은 두 가지 중요한 한계에 직면해 있습니다: 1) 기존의 자기 수정 방법은 대형 언어 모델(LLM)의 재귀적 호출에 의존하여 계산 오버헤드가 기하급수적으로 증가하며, 2) LLM은 선언적 SQL 쿼리에 대한 효과적인 오류 탐지 및 수정을 구현하는 데 어려움을 겪습니다. 이는 근본적인 추론 경로를 제대로 보여주지 못하기 때문입니다. 본 연구에서는 SHARE(SLM 기반 계층적 액션 수정 보조 도구)를 제안하여 LLM이 더 정확한 오류 위치 파악과 효율적인 수정을 수행할 수 있도록 합니다. SHARE는 세 개의 특화된 소형 언어 모델(SLM)을 순차적 파이프라인으로 구성하며, 먼저 선언적 SQL 쿼리를 단계별 액션 트레이젝토리로 변환하여 근본적인 추론을 드러내고, 이어서 두 단계의 세분화된 정제 과정을 거칩니다. 또한, 데이터 효율적인 학습을 위한 새로운 계층적 자기 진화 전략을 제안합니다. 실험 결과는 SHARE가 다양한 LLM에서 강건성을 입증하면서도 자기 수정 능력을 효과적으로 향상시킴을 보여줍니다. 더 나아가, 종합적인 분석을 통해 SHARE가 데이터 프라이버시 제약이 있는 텍스트-to-SQL 애플리케이션에서 특히 유용한 저자원 학습 환경에서도 강력한 성능을 유지함을 확인했습니다.
English
Current self-correction approaches in text-to-SQL face two critical limitations: 1) Conventional self-correction methods rely on recursive self-calls of LLMs, resulting in multiplicative computational overhead, and 2) LLMs struggle to implement effective error detection and correction for declarative SQL queries, as they fail to demonstrate the underlying reasoning path. In this work, we propose SHARE, an SLM-based Hierarchical Action corREction assistant that enables LLMs to perform more precise error localization and efficient correction. SHARE orchestrates three specialized Small Language Models (SLMs) in a sequential pipeline, where it first transforms declarative SQL queries into stepwise action trajectories that reveal underlying reasoning, followed by a two-phase granular refinement. We further propose a novel hierarchical self-evolution strategy for data-efficient training. Experimental results demonstrate that SHARE effectively enhances self-correction capabilities while proving robust across various LLMs. Furthermore, our comprehensive analysis shows that SHARE maintains strong performance even in low-resource training settings, which is particularly valuable for text-to-SQL applications with data privacy constraints.
PDF32June 4, 2025