소프트웨어 공학에서 LLM 기반 이슈 해결의 발전과 최전선: 포괄적 조사
Advances and Frontiers of LLM-based Issue Resolution in Software Engineering: A Comprehensive Survey
January 15, 2026
저자: Caihua Li, Lianghong Guo, Yanlin Wang, Daya Guo, Wei Tao, Zhenyu Shan, Mingwei Liu, Jiachi Chen, Haoyu Song, Duyu Tang, Hongyu Zhang, Zibin Zheng
cs.AI
초록
이슈 해결은 실제 소프트웨어 개발에 필수적인 복잡한 소프트웨어 공학 과업으로, 인공 지능에게 매력적인 도전 과제로 부상하고 있습니다. SWE-bench와 같은 벤치마크의 등장은 이 과업이 대규모 언어 모델에게 매우 어려운 것으로 밝혀지며, 자율 코딩 에이전트의 진화를 크게 가속시켰습니다. 본 논문은 이 신생 분야에 대한 체계적인 조사를 제시합니다. 먼저 자동화된 수집 및 합성 방식을 아우르는 데이터 구축 파이프라인을 검토합니다. 다음으로, 모듈식 구성 요소를 갖춘 학습 불필요 프레임워크부터 지도 미세 조정 및 강화 학습을 포함한 학습 기반 기술에 이르기까지 방법론에 대한 포괄적인 분석을 제공합니다. 이후 데이터 품질과 에이전트 행동에 대한 비판적 분석과 실제 적용 사례를 논의합니다. 마지막으로 핵심 과제를 식별하고 향후 연구를 위한 유망한 방향을 제시합니다. 본 분야의 동적 자원으로 활용될 오픈소스 저장소를 https://github.com/DeepSoftwareAnalytics/Awesome-Issue-Resolution 에서 유지 관리하고 있습니다.
English
Issue resolution, a complex Software Engineering (SWE) task integral to real-world development, has emerged as a compelling challenge for artificial intelligence. The establishment of benchmarks like SWE-bench revealed this task as profoundly difficult for large language models, thereby significantly accelerating the evolution of autonomous coding agents. This paper presents a systematic survey of this emerging domain. We begin by examining data construction pipelines, covering automated collection and synthesis approaches. We then provide a comprehensive analysis of methodologies, spanning training-free frameworks with their modular components to training-based techniques, including supervised fine-tuning and reinforcement learning. Subsequently, we discuss critical analyses of data quality and agent behavior, alongside practical applications. Finally, we identify key challenges and outline promising directions for future research. An open-source repository is maintained at https://github.com/DeepSoftwareAnalytics/Awesome-Issue-Resolution to serve as a dynamic resource in this field.