Qwen2.5-Coder 기술 보고서Qwen2.5-Coder Technical Report
이 보고서에서는 이전 버전인 CodeQwen1.5로부터의 중요한 업그레이드 인 Qwen2.5-Coder 시리즈를 소개합니다. 이 시리즈에는 두 가지 모델이 포함되어 있습니다: Qwen2.5-Coder-1.5B 및 Qwen2.5-Coder-7B. 코드에 특화된 모델인 Qwen2.5-Coder는 Qwen2.5 아키텍처를 기반으로 구축되었으며 5.5조 개 이상의 토큰으로 구성된 방대한 말뭉치에서 사전 훈련을 받았습니다. 세심한 데이터 정제, 확장 가능한 합성 데이터 생성 및 균형 잡힌 데이터 혼합을 통해 Qwen2.5-Coder는 일반적인 다재다능성을 유지하면서도 탁월한 코드 생성 능력을 나타냅니다. 이 모델은 코드 생성, 완성, 추론 및 수리를 포함한 다양한 코드 관련 작업에서 평가되었으며, 동일한 모델 크기의 더 큰 모델들을 일관되게 능가하며 10개 이상의 벤치마크에서 최신 기술 성능을 달성했습니다. 우리는 Qwen2.5-Coder 시리즈의 출시가 코드 지능 연구의 경계를 넓히는 데 그치지 않고 허가받은 라이선스를 통해 실제 응용 프로그램 개발자들에게 보다 널리 채택되도록 장려할 것이라고 믿습니다.