ChatPaper.aiChatPaper

Avances y Fronteras de la Resolución de Problemas Basada en LLM en Ingeniería de Software: Una Revisión Exhaustiva

Advances and Frontiers of LLM-based Issue Resolution in Software Engineering: A Comprehensive Survey

January 15, 2026
Autores: Caihua Li, Lianghong Guo, Yanlin Wang, Daya Guo, Wei Tao, Zhenyu Shan, Mingwei Liu, Jiachi Chen, Haoyu Song, Duyu Tang, Hongyu Zhang, Zibin Zheng
cs.AI

Resumen

La resolución de incidencias, una tarea compleja de Ingeniería del Software (IS) integral al desarrollo en entornos reales, ha surgido como un desafío fascinante para la inteligencia artificial. El establecimiento de puntos de referencia como SWE-bench reveló que esta tarea es extremadamente difícil para los modelos de lenguaje grandes, acelerando así significativamente la evolución de los agentes de codificación autónomos. Este artículo presenta un estudio sistemático de este dominio emergente. Comenzamos examinando las canalizaciones de construcción de datos, cubriendo enfoques de recopilación automatizada y síntesis. A continuación, proporcionamos un análisis exhaustivo de las metodologías, abarcando desde marcos libres de entrenamiento con sus componentes modulares hasta técnicas basadas en entrenamiento, incluyendo el ajuste fino supervisado y el aprendizaje por refuerzo. Posteriormente, discutimos análisis críticos sobre la calidad de los datos y el comportamiento de los agentes, junto con aplicaciones prácticas. Finalmente, identificamos desafíos clave y esbozamos direcciones prometedoras para la investigación futura. Se mantiene un repositorio de código abierto en https://github.com/DeepSoftwareAnalytics/Awesome-Issue-Resolution para servir como un recurso dinámico en este campo.
English
Issue resolution, a complex Software Engineering (SWE) task integral to real-world development, has emerged as a compelling challenge for artificial intelligence. The establishment of benchmarks like SWE-bench revealed this task as profoundly difficult for large language models, thereby significantly accelerating the evolution of autonomous coding agents. This paper presents a systematic survey of this emerging domain. We begin by examining data construction pipelines, covering automated collection and synthesis approaches. We then provide a comprehensive analysis of methodologies, spanning training-free frameworks with their modular components to training-based techniques, including supervised fine-tuning and reinforcement learning. Subsequently, we discuss critical analyses of data quality and agent behavior, alongside practical applications. Finally, we identify key challenges and outline promising directions for future research. An open-source repository is maintained at https://github.com/DeepSoftwareAnalytics/Awesome-Issue-Resolution to serve as a dynamic resource in this field.
PDF492January 22, 2026