SQL-of-Thought: Multi-agentisches Text-zu-SQL mit geführter Fehlerkorrektur
SQL-of-Thought: Multi-agentic Text-to-SQL with Guided Error Correction
August 30, 2025
papers.authors: Saumya Chaturvedi, Aman Chadha, Laurent Bindschaedler
cs.AI
papers.abstract
Die Umwandlung von natürlichen Sprachanfragen in SQL-Abfragen stellt eine entscheidende Herausforderung sowohl in der Industrie als auch in der Wissenschaft dar, mit dem Ziel, den Zugang zu Datenbanken und groß angelegten Anwendungen zu verbessern. Diese Arbeit untersucht, wie In-Context-Lernen und Chain-of-Thought genutzt werden können, um eine robuste Lösung für Text-to-SQL-Systeme zu entwickeln. Wir schlagen SQL-of-Thought vor: ein Multi-Agenten-Framework, das die Text2SQL-Aufgabe in Schema-Linking, Unterproblemidentifikation, Abfrageplangenerierung, SQL-Generierung und eine geführte Korrekturschleife zerlegt. Im Gegensatz zu früheren Systemen, die sich ausschließlich auf ausführungsbasierte statische Korrektur verlassen, führen wir eine taxonomiegesteuerte dynamische Fehlermodifikation ein, die durch In-Context-Lernen informiert wird. SQL-of-Thought erzielt state-of-the-art Ergebnisse auf dem Spider-Datensatz und seinen Varianten, indem es eine geführte Fehlertaxonomie mit einer auf logischem Denken basierenden Abfrageplanung kombiniert.
English
Converting natural language queries into SQL queries is a crucial challenge
in both industry and academia, aiming to increase access to databases and
large-scale applications. This work examines how in-context learning and
chain-of-thought can be utilized to develop a robust solution for text-to-SQL
systems. We propose SQL-of-Thought: a multi-agent framework that decomposes the
Text2SQL task into schema linking, subproblem identification, query plan
generation, SQL generation, and a guided correction loop. Unlike prior systems
that rely only on execution-based static correction, we introduce
taxonomy-guided dynamic error modification informed by in-context learning.
SQL-of-Thought achieves state-of-the-art results on the Spider dataset and its
variants, combining guided error taxonomy with reasoning-based query planning.