Feather-SQL: 소형 언어 모델을 위한 이중 모델 협업 패러다임의 경량 NL2SQL 프레임워크
Feather-SQL: A Lightweight NL2SQL Framework with Dual-Model Collaboration Paradigm for Small Language Models
March 22, 2025
저자: Wenqi Pei, Hailing Xu, Hengyuan Zhao, Shizheng Hou, Han Chen, Zining Zhang, Pingyi Luo, Bingsheng He
cs.AI
초록
자연어에서 SQL로의 변환(NL2SQL)은 대규모 언어 모델(LLMs)의 발전으로 상당한 진전을 이루었습니다. 그러나 이러한 모델들은 종종 폐쇄형 시스템과 높은 컴퓨팅 자원에 의존하기 때문에 데이터 프라이버시와 배포 측면에서 어려움을 겪고 있습니다. 반면, 소규모 언어 모델(SLMs)은 NL2SQL 작업에서 성능이 낮고 기존 프레임워크와의 호환성이 부족한 문제를 보입니다. 이러한 문제를 해결하기 위해, 우리는 SLMs에 맞춤화된 새로운 경량 프레임워크인 Feather-SQL을 소개합니다. Feather-SQL은 1) 스키마 정제 및 연결, 2) 다중 경로 및 다중 후보 생성을 통해 SQL 실행 가능성과 정확성을 향상시킵니다. 또한, 강력한 일반 목적 채팅 모델과 정밀하게 조정된 SQL 전문가 모델을 결합한 1+1 모델 협업 패러다임을 도입하여 강력한 분석적 추론과 고정밀 SQL 생성을 결합합니다. BIRD 데이터셋에서의 실험 결과는 Feather-SQL이 SLMs의 NL2SQL 성능을 향상시키며, 미세 조정 없이도 약 10%의 성능 향상을 보여줍니다. 제안된 패러다임은 SLMs의 정확도 상한선을 54.76%까지 끌어올려 그 효과성을 입증했습니다.
English
Natural Language to SQL (NL2SQL) has seen significant advancements with large
language models (LLMs). However, these models often depend on closed-source
systems and high computational resources, posing challenges in data privacy and
deployment. In contrast, small language models (SLMs) struggle with NL2SQL
tasks, exhibiting poor performance and incompatibility with existing
frameworks. To address these issues, we introduce Feather-SQL, a new
lightweight framework tailored for SLMs. Feather-SQL improves SQL executability
and accuracy through 1) schema pruning and linking, 2) multi-path and
multi-candidate generation. Additionally, we introduce the 1+1 Model
Collaboration Paradigm, which pairs a strong general-purpose chat model with a
fine-tuned SQL specialist, combining strong analytical reasoning with
high-precision SQL generation. Experimental results on BIRD demonstrate that
Feather-SQL improves NL2SQL performance on SLMs, with around 10% boost for
models without fine-tuning. The proposed paradigm raises the accuracy ceiling
of SLMs to 54.76%, highlighting its effectiveness.Summary
AI-Generated Summary