ChatPaper.aiChatPaper

Feather-SQL: Um Framework Leve de NL2SQL com Paradigma de Colaboração de Modelos Duplos para Modelos de Linguagem Pequenos

Feather-SQL: A Lightweight NL2SQL Framework with Dual-Model Collaboration Paradigm for Small Language Models

March 22, 2025
Autores: Wenqi Pei, Hailing Xu, Hengyuan Zhao, Shizheng Hou, Han Chen, Zining Zhang, Pingyi Luo, Bingsheng He
cs.AI

Resumo

A conversão de Linguagem Natural para SQL (NL2SQL) tem apresentado avanços significativos com os grandes modelos de linguagem (LLMs). No entanto, esses modelos frequentemente dependem de sistemas de código fechado e de altos recursos computacionais, o que gera desafios em termos de privacidade de dados e implantação. Em contraste, os pequenos modelos de linguagem (SLMs) enfrentam dificuldades em tarefas de NL2SQL, exibindo desempenho insatisfatório e incompatibilidade com os frameworks existentes. Para resolver esses problemas, apresentamos o Feather-SQL, um novo framework leve projetado especificamente para SLMs. O Feather-SQL melhora a executabilidade e a precisão do SQL por meio de 1) poda e vinculação de esquemas, e 2) geração de múltiplos caminhos e múltiplos candidatos. Além disso, introduzimos o Paradigma de Colaboração de Modelos 1+1, que combina um modelo de chat de propósito geral robusto com um especialista em SQL ajustado, unindo raciocínio analítico forte com geração de SQL de alta precisão. Resultados experimentais no BIRD demonstram que o Feather-SQL melhora o desempenho de NL2SQL em SLMs, com um aumento de aproximadamente 10% para modelos sem ajuste fino. O paradigma proposto eleva o limite de precisão dos SLMs para 54,76%, destacando sua eficácia.
English
Natural Language to SQL (NL2SQL) has seen significant advancements with large language models (LLMs). However, these models often depend on closed-source systems and high computational resources, posing challenges in data privacy and deployment. In contrast, small language models (SLMs) struggle with NL2SQL tasks, exhibiting poor performance and incompatibility with existing frameworks. To address these issues, we introduce Feather-SQL, a new lightweight framework tailored for SLMs. Feather-SQL improves SQL executability and accuracy through 1) schema pruning and linking, 2) multi-path and multi-candidate generation. Additionally, we introduce the 1+1 Model Collaboration Paradigm, which pairs a strong general-purpose chat model with a fine-tuned SQL specialist, combining strong analytical reasoning with high-precision SQL generation. Experimental results on BIRD demonstrate that Feather-SQL improves NL2SQL performance on SLMs, with around 10% boost for models without fine-tuning. The proposed paradigm raises the accuracy ceiling of SLMs to 54.76%, highlighting its effectiveness.

Summary

AI-Generated Summary

PDF132March 25, 2025