ChatPaper.aiChatPaper

SWE-Flow: 테스트 주도 방식으로 소프트웨어 엔지니어링 데이터를 합성하기

SWE-Flow: Synthesizing Software Engineering Data in a Test-Driven Manner

June 10, 2025
저자: Lei Zhang, Jiaxi Yang, Min Yang, Jian Yang, Mouxiang Chen, Jiajun Zhang, Zeyu Cui, Binyuan Hui, Junyang Lin
cs.AI

초록

**SWE-Flow**는 테스트 주도 개발(TDD)에 기반한 새로운 데이터 합성 프레임워크를 소개합니다. 기존의 소프트웨어 엔지니어링 데이터가 인간이 제출한 이슈에 의존하는 것과 달리, **SWE-Flow**는 단위 테스트에서 직접 증분 개발 단계를 자동으로 추론합니다. 단위 테스트는 본질적으로 높은 수준의 요구사항을 포함하고 있습니다. **SWE-Flow**의 핵심은 런타임 의존성 그래프(RDG)를 구성하는 것으로, 이는 함수 간 상호작용을 정확히 포착하여 구조화된 단계별 *개발 일정*을 생성할 수 있게 합니다. 각 단계에서 **SWE-Flow**는 부분적인 코드베이스, 해당 단위 테스트, 그리고 필요한 코드 수정 사항을 생성하여 완전히 검증 가능한 TDD 작업을 제공합니다. 이 접근법을 통해 실제 GitHub 프로젝트에서 16,061개의 훈련 인스턴스와 2,020개의 테스트 인스턴스를 생성하여 **SWE-Flow-Eval** 벤치마크를 만들었습니다. 실험 결과, 이 데이터셋으로 오픈 모델을 미세 조정하면 TDD 기반 코딩에서 성능이 크게 향상됨을 보여줍니다. 추가 연구를 위해 모든 코드, 데이터셋, 모델, 그리고 Docker 이미지를 [Github](https://github.com/Hambaobao/SWE-Flow)에 공개합니다.
English
We introduce **SWE-Flow**, a novel data synthesis framework grounded in Test-Driven Development (TDD). Unlike existing software engineering data that rely on human-submitted issues, **SWE-Flow** automatically infers incremental development steps directly from unit tests, which inherently encapsulate high-level requirements. The core of **SWE-Flow** is the construction of a Runtime Dependency Graph (RDG), which precisely captures function interactions, enabling the generation of a structured, step-by-step *development schedule*. At each step, **SWE-Flow** produces a partial codebase, the corresponding unit tests, and the necessary code modifications, resulting in fully verifiable TDD tasks. With this approach, we generated 16,061 training instances and 2,020 test instances from real-world GitHub projects, creating the **SWE-Flow-Eval** benchmark. Our experiments show that fine-tuning open model on this dataset significantly improves performance in TDD-based coding. To facilitate further research, we release all code, datasets, models, and Docker images at [Github](https://github.com/Hambaobao/SWE-Flow).
PDF153June 12, 2025