SQL-of-Thought : Text-to-SQL multi-agent avec correction d'erreurs guidée
SQL-of-Thought: Multi-agentic Text-to-SQL with Guided Error Correction
August 30, 2025
papers.authors: Saumya Chaturvedi, Aman Chadha, Laurent Bindschaedler
cs.AI
papers.abstract
La conversion de requêtes en langage naturel en requêtes SQL constitue un défi crucial tant dans l'industrie que dans le milieu académique, visant à accroître l'accès aux bases de données et aux applications à grande échelle. Ce travail explore comment l'apprentissage en contexte et la chaîne de raisonnement peuvent être utilisés pour développer une solution robuste pour les systèmes de conversion de texte en SQL. Nous proposons SQL-of-Thought : un cadre multi-agent qui décompose la tâche Text2SQL en liaison de schéma, identification de sous-problèmes, génération de plan de requête, génération de SQL et une boucle de correction guidée. Contrairement aux systèmes antérieurs qui reposent uniquement sur une correction statique basée sur l'exécution, nous introduisons une modification dynamique des erreurs guidée par une taxonomie, informée par l'apprentissage en contexte. SQL-of-Thought obtient des résultats de pointe sur le jeu de données Spider et ses variantes, en combinant une taxonomie d'erreurs guidée avec une planification de requêtes basée sur le raisonnement.
English
Converting natural language queries into SQL queries is a crucial challenge
in both industry and academia, aiming to increase access to databases and
large-scale applications. This work examines how in-context learning and
chain-of-thought can be utilized to develop a robust solution for text-to-SQL
systems. We propose SQL-of-Thought: a multi-agent framework that decomposes the
Text2SQL task into schema linking, subproblem identification, query plan
generation, SQL generation, and a guided correction loop. Unlike prior systems
that rely only on execution-based static correction, we introduce
taxonomy-guided dynamic error modification informed by in-context learning.
SQL-of-Thought achieves state-of-the-art results on the Spider dataset and its
variants, combining guided error taxonomy with reasoning-based query planning.