Feather-SQL: Облегченный фреймворк NL2SQL с парадигмой совместной работы двух моделей для малых языковых моделей
Feather-SQL: A Lightweight NL2SQL Framework with Dual-Model Collaboration Paradigm for Small Language Models
March 22, 2025
Авторы: Wenqi Pei, Hailing Xu, Hengyuan Zhao, Shizheng Hou, Han Chen, Zining Zhang, Pingyi Luo, Bingsheng He
cs.AI
Аннотация
Преобразование естественного языка в SQL (NL2SQL) значительно продвинулось благодаря крупным языковым моделям (LLM). Однако эти модели часто зависят от закрытых систем и требуют значительных вычислительных ресурсов, что создает проблемы с конфиденциальностью данных и развертыванием. В то же время небольшие языковые модели (SLM) демонстрируют низкую производительность и несовместимость с существующими фреймворками в задачах NL2SQL. Для решения этих проблем мы представляем Feather-SQL — новый легковесный фреймворк, разработанный специально для SLM. Feather-SQL повышает выполнимость и точность SQL за счет 1) обрезки и связывания схемы, 2) генерации множественных путей и кандидатов. Кроме того, мы предлагаем парадигму 1+1 Model Collaboration, которая объединяет мощную универсальную чат-модель с тонко настроенным специалистом по SQL, сочетая сильные аналитические способности с высокой точностью генерации SQL. Экспериментальные результаты на наборе данных BIRD показывают, что Feather-SQL улучшает производительность NL2SQL для SLM, обеспечивая прирост около 10% для моделей без тонкой настройки. Предложенная парадигма повышает максимальную точность SLM до 54,76%, подтверждая ее эффективность.
English
Natural Language to SQL (NL2SQL) has seen significant advancements with large
language models (LLMs). However, these models often depend on closed-source
systems and high computational resources, posing challenges in data privacy and
deployment. In contrast, small language models (SLMs) struggle with NL2SQL
tasks, exhibiting poor performance and incompatibility with existing
frameworks. To address these issues, we introduce Feather-SQL, a new
lightweight framework tailored for SLMs. Feather-SQL improves SQL executability
and accuracy through 1) schema pruning and linking, 2) multi-path and
multi-candidate generation. Additionally, we introduce the 1+1 Model
Collaboration Paradigm, which pairs a strong general-purpose chat model with a
fine-tuned SQL specialist, combining strong analytical reasoning with
high-precision SQL generation. Experimental results on BIRD demonstrate that
Feather-SQL improves NL2SQL performance on SLMs, with around 10% boost for
models without fine-tuning. The proposed paradigm raises the accuracy ceiling
of SLMs to 54.76%, highlighting its effectiveness.Summary
AI-Generated Summary