ChatPaper.aiChatPaper

大規模言語モデルに基づくソフトウェア工学課題解決の進展と最先端:包括的サーベイ

Advances and Frontiers of LLM-based Issue Resolution in Software Engineering: A Comprehensive Survey

January 15, 2026
著者: Caihua Li, Lianghong Guo, Yanlin Wang, Daya Guo, Wei Tao, Zhenyu Shan, Mingwei Liu, Jiachi Chen, Haoyu Song, Duyu Tang, Hongyu Zhang, Zibin Zheng
cs.AI

要旨

課題解決は、現実世界のソフトウェア開発において不可欠な複雑なソフトウェア工学(SWE)タスクであり、人工知能にとって魅力的な課題として浮上している。SWE-benchのようなベンチマークの確立により、このタスクが大規模言語モデルにとって極めて困難であることが明らかになり、自律型コーディングエージェントの進化を大幅に加速させた。本論文では、この新興領域に関する体系的サーベイを提示する。まず、データ構築パイプラインを検討し、自動収集と合成アプローチを網羅する。次に、モジュラー構成要素を持つトレーニング不要のフレームワークから、教師ありファインチューニングや強化学習を含むトレーニングベースの技術まで、方法論の包括的分析を提供する。続いて、データ品質とエージェント挙動に関する批判的考察を実践応用と共に議論する。最後に、主要な課題を特定し、将来研究の有望な方向性を概説する。この分野の動的リソースとして、オープンソースリポジトリをhttps://github.com/DeepSoftwareAnalytics/Awesome-Issue-Resolution で維持している。
English
Issue resolution, a complex Software Engineering (SWE) task integral to real-world development, has emerged as a compelling challenge for artificial intelligence. The establishment of benchmarks like SWE-bench revealed this task as profoundly difficult for large language models, thereby significantly accelerating the evolution of autonomous coding agents. This paper presents a systematic survey of this emerging domain. We begin by examining data construction pipelines, covering automated collection and synthesis approaches. We then provide a comprehensive analysis of methodologies, spanning training-free frameworks with their modular components to training-based techniques, including supervised fine-tuning and reinforcement learning. Subsequently, we discuss critical analyses of data quality and agent behavior, alongside practical applications. Finally, we identify key challenges and outline promising directions for future research. An open-source repository is maintained at https://github.com/DeepSoftwareAnalytics/Awesome-Issue-Resolution to serve as a dynamic resource in this field.
PDF492January 22, 2026