Avanços e Fronteiras na Resolução de Problemas Baseada em LLM na Engenharia de Software: Um Estudo Abrangente

Resumo

A resolução de problemas, uma tarefa complexa de Engenharia de Software (ESW) integrante do desenvolvimento do mundo real, emergiu como um desafio atraente para a inteligência artificial. O estabelecimento de *benchmarks* como o SWE-bench revelou que esta tarefa é profundamente difícil para modelos de linguagem de grande escala, acelerando assim significativamente a evolução de agentes de codificação autónomos. Este artigo apresenta um levantamento sistemático deste domínio emergente. Começamos por examinar os *pipelines* de construção de dados, abrangendo abordagens de recolha e síntese automatizadas. Em seguida, fornecemos uma análise abrangente das metodologias, abrangendo desde arquiteturas sem treino com os seus componentes modulares até técnicas baseadas em treino, incluindo o ajuste fino supervisionado e a aprendizagem por reforço. Posteriormente, discutimos análises críticas sobre a qualidade dos dados e o comportamento do agente, juntamente com aplicações práticas. Por fim, identificamos desafios-chave e delineamos direções promissoras para pesquisas futuras. Um repositório de código aberto é mantido em https://github.com/DeepSoftwareAnalytics/Awesome-Issue-Resolution para servir como um recurso dinâmico nesta área.

English

Issue resolution, a complex Software Engineering (SWE) task integral to real-world development, has emerged as a compelling challenge for artificial intelligence. The establishment of benchmarks like SWE-bench revealed this task as profoundly difficult for large language models, thereby significantly accelerating the evolution of autonomous coding agents. This paper presents a systematic survey of this emerging domain. We begin by examining data construction pipelines, covering automated collection and synthesis approaches. We then provide a comprehensive analysis of methodologies, spanning training-free frameworks with their modular components to training-based techniques, including supervised fine-tuning and reinforcement learning. Subsequently, we discuss critical analyses of data quality and agent behavior, alongside practical applications. Finally, we identify key challenges and outline promising directions for future research. An open-source repository is maintained at https://github.com/DeepSoftwareAnalytics/Awesome-Issue-Resolution to serve as a dynamic resource in this field.