ChatPaper.aiChatPaper

Progrès et Frontières de la Résolution de Problèmes basée sur les LLM en Ingénierie Logicielle : Une Étude Complète

Advances and Frontiers of LLM-based Issue Resolution in Software Engineering: A Comprehensive Survey

January 15, 2026
papers.authors: Caihua Li, Lianghong Guo, Yanlin Wang, Daya Guo, Wei Tao, Zhenyu Shan, Mingwei Liu, Jiachi Chen, Haoyu Song, Duyu Tang, Hongyu Zhang, Zibin Zheng
cs.AI

papers.abstract

La résolution d'issues, une tâche complexe du génie logiciel (Software Engineering - SWE) intégrée au développement réel, est devenue un défi majeur pour l'intelligence artificielle. La création de benchmarks comme SWE-bench a révélé la difficulté considérable de cette tâche pour les grands modèles de langage, accélérant ainsi significativement l'évolution des agents de codage autonomes. Cet article présente une étude systématique de ce domaine émergent. Nous commençons par examiner les pipelines de construction de données, couvrant les approches de collecte automatisée et de synthèse. Nous proposons ensuite une analyse complète des méthodologies, allant des frameworks sans entraînement avec leurs composants modulaires aux techniques basées sur l'entraînement, incluant le fine-tuning supervisé et l'apprentissage par renforcement. Par la suite, nous discutons des analyses critiques concernant la qualité des données et le comportement des agents, ainsi que des applications pratiques. Enfin, nous identifions les défis clés et esquissons les orientations prometteuses pour les recherches futures. Un dépôt open source est maintenu à l'adresse https://github.com/DeepSoftwareAnalytics/Awesome-Issue-Resolution pour servir de ressource dynamique dans ce domaine.
English
Issue resolution, a complex Software Engineering (SWE) task integral to real-world development, has emerged as a compelling challenge for artificial intelligence. The establishment of benchmarks like SWE-bench revealed this task as profoundly difficult for large language models, thereby significantly accelerating the evolution of autonomous coding agents. This paper presents a systematic survey of this emerging domain. We begin by examining data construction pipelines, covering automated collection and synthesis approaches. We then provide a comprehensive analysis of methodologies, spanning training-free frameworks with their modular components to training-based techniques, including supervised fine-tuning and reinforcement learning. Subsequently, we discuss critical analyses of data quality and agent behavior, alongside practical applications. Finally, we identify key challenges and outline promising directions for future research. An open-source repository is maintained at https://github.com/DeepSoftwareAnalytics/Awesome-Issue-Resolution to serve as a dynamic resource in this field.
PDF492January 22, 2026