Fortschritte und Grenzen LLM-basierter Problemlösung in der Softwareentwicklung: Eine umfassende Übersicht
Advances and Frontiers of LLM-based Issue Resolution in Software Engineering: A Comprehensive Survey
January 15, 2026
papers.authors: Caihua Li, Lianghong Guo, Yanlin Wang, Daya Guo, Wei Tao, Zhenyu Shan, Mingwei Liu, Jiachi Chen, Haoyu Song, Duyu Tang, Hongyu Zhang, Zibin Zheng
cs.AI
papers.abstract
Die Lösung von Issues, eine komplexe Aufgabe der Softwareentwicklung (SWE), die integraler Bestandteil der Praxis ist, hat sich zu einer bedeutenden Herausforderung für die Künstliche Intelligenz entwickelt. Die Etablierung von Benchmarks wie SWE-bench zeigte, dass diese Aufgabe für große Sprachmodelle äußerst schwierig ist, was die Entwicklung autonomer Code-Agenten erheblich beschleunigt hat. Dieser Beitrag stellt eine systematische Übersicht über dieses aufstrebende Forschungsgebiet vor. Wir beginnen mit der Untersuchung von Datenkonstruktions-Pipelines, die automatisierte Erhebungs- und Syntheseansätze abdecken. Anschließend bieten wir eine umfassende Analyse der Methoden, die von trainingsfreien Frameworks mit ihren modularen Komponenten bis hin zu trainingsbasierten Techniken wie supervised Fine-Tuning und Reinforcement Learning reichen. Darauf folgt eine kritische Diskussion von Datenqualität und Agentenverhalten sowie praktischen Anwendungen. Abschließend identifizieren wir zentrale Herausforderungen und skizzieren vielversprechende Richtungen für die zukünftige Forschung. Ein Open-Source-Repository wird unter https://github.com/DeepSoftwareAnalytics/Awesome-Issue-Resolution gepflegt und dient als dynamische Ressource für dieses Feld.
English
Issue resolution, a complex Software Engineering (SWE) task integral to real-world development, has emerged as a compelling challenge for artificial intelligence. The establishment of benchmarks like SWE-bench revealed this task as profoundly difficult for large language models, thereby significantly accelerating the evolution of autonomous coding agents. This paper presents a systematic survey of this emerging domain. We begin by examining data construction pipelines, covering automated collection and synthesis approaches. We then provide a comprehensive analysis of methodologies, spanning training-free frameworks with their modular components to training-based techniques, including supervised fine-tuning and reinforcement learning. Subsequently, we discuss critical analyses of data quality and agent behavior, alongside practical applications. Finally, we identify key challenges and outline promising directions for future research. An open-source repository is maintained at https://github.com/DeepSoftwareAnalytics/Awesome-Issue-Resolution to serve as a dynamic resource in this field.