ChatPaper.aiChatPaper

Feather-SQL: Een lichtgewicht NL2SQL-framework met een dual-model samenwerkingsparadigma voor kleine taalmodellen

Feather-SQL: A Lightweight NL2SQL Framework with Dual-Model Collaboration Paradigm for Small Language Models

March 22, 2025
Auteurs: Wenqi Pei, Hailing Xu, Hengyuan Zhao, Shizheng Hou, Han Chen, Zining Zhang, Pingyi Luo, Bingsheng He
cs.AI

Samenvatting

Natural Language to SQL (NL2SQL) heeft aanzienlijke vooruitgang geboekt met grote taalmodellen (LLMs). Deze modellen zijn echter vaak afhankelijk van gesloten bron systemen en hoge rekenkracht, wat uitdagingen oplevert op het gebied van gegevensprivacy en implementatie. Kleine taalmodellen (SLMs) daarentegen, hebben moeite met NL2SQL-taken, waarbij ze slechte prestaties vertonen en incompatibel zijn met bestaande frameworks. Om deze problemen aan te pakken, introduceren we Feather-SQL, een nieuw lichtgewicht framework speciaal ontworpen voor SLMs. Feather-SQL verbetert de uitvoerbaarheid en nauwkeurigheid van SQL door 1) schema-snoei en -koppeling, 2) multi-pad en multi-kandidaatgeneratie. Daarnaast introduceren we het 1+1 Model Collaboration Paradigm, dat een sterk algemeen chatmodel combineert met een fijn afgestemd SQL-specialist, waardoor sterke analytische redenering wordt gecombineerd met hoogwaardige SQL-generatie. Experimentele resultaten op BIRD tonen aan dat Feather-SQL de NL2SQL-prestaties van SLMs verbetert, met een boost van ongeveer 10% voor modellen zonder fijnafstemming. Het voorgestelde paradigma verhoogt de nauwkeurigheidsgrens van SLMs tot 54,76%, wat de effectiviteit ervan benadrukt.
English
Natural Language to SQL (NL2SQL) has seen significant advancements with large language models (LLMs). However, these models often depend on closed-source systems and high computational resources, posing challenges in data privacy and deployment. In contrast, small language models (SLMs) struggle with NL2SQL tasks, exhibiting poor performance and incompatibility with existing frameworks. To address these issues, we introduce Feather-SQL, a new lightweight framework tailored for SLMs. Feather-SQL improves SQL executability and accuracy through 1) schema pruning and linking, 2) multi-path and multi-candidate generation. Additionally, we introduce the 1+1 Model Collaboration Paradigm, which pairs a strong general-purpose chat model with a fine-tuned SQL specialist, combining strong analytical reasoning with high-precision SQL generation. Experimental results on BIRD demonstrate that Feather-SQL improves NL2SQL performance on SLMs, with around 10% boost for models without fine-tuning. The proposed paradigm raises the accuracy ceiling of SLMs to 54.76%, highlighting its effectiveness.

Summary

AI-Generated Summary

PDF132March 25, 2025