SQL-of-Thought: Мультиагентный Text-to-SQL с управляемой коррекцией ошибок
SQL-of-Thought: Multi-agentic Text-to-SQL with Guided Error Correction
August 30, 2025
Авторы: Saumya Chaturvedi, Aman Chadha, Laurent Bindschaedler
cs.AI
Аннотация
Преобразование запросов на естественном языке в SQL-запросы представляет собой важную задачу как в промышленности, так и в академических исследованиях, направленную на упрощение доступа к базам данных и крупномасштабным приложениям. В данной работе исследуется, как обучение в контексте и цепочка рассуждений могут быть использованы для создания надежного решения для систем преобразования текста в SQL. Мы предлагаем SQL-of-Thought: многоагентный фреймворк, который разбивает задачу Text2SQL на этапы связывания схемы, идентификации подзадач, генерации плана запроса, создания SQL-запроса и цикла управляемой коррекции. В отличие от предыдущих систем, которые полагаются исключительно на статическую коррекцию на основе выполнения, мы вводим динамическое исправление ошибок, управляемое таксономией и основанное на обучении в контексте. SQL-of-Thought достигает передовых результатов на наборе данных Spider и его вариантах, сочетая управляемую таксономию ошибок с планированием запросов на основе рассуждений.
English
Converting natural language queries into SQL queries is a crucial challenge
in both industry and academia, aiming to increase access to databases and
large-scale applications. This work examines how in-context learning and
chain-of-thought can be utilized to develop a robust solution for text-to-SQL
systems. We propose SQL-of-Thought: a multi-agent framework that decomposes the
Text2SQL task into schema linking, subproblem identification, query plan
generation, SQL generation, and a guided correction loop. Unlike prior systems
that rely only on execution-based static correction, we introduce
taxonomy-guided dynamic error modification informed by in-context learning.
SQL-of-Thought achieves state-of-the-art results on the Spider dataset and its
variants, combining guided error taxonomy with reasoning-based query planning.