ChatPaper.aiChatPaper

공자 코드 에이전트: 산업 규모의 오픈소스 AI 소프트웨어 엔지니어

Confucius Code Agent: An Open-sourced AI Software Engineer at Industrial Scale

December 11, 2025
저자: Zhaodong Wang, Zhenting Qi, Sherman Wong, Nathan Hu, Samuel Lin, Jun Ge, Erwin Gao, Yining Yang, Ben Maurer, Wenlin Chen, David Recordon, Yilun Du, Minlan Yu, Ying Zhang
cs.AI

초록

실제 AI 소프트웨어 엔지니어링에는 방대한 저장소를 추론하고, 긴 세션 간 및 세션 내에서 지속적인 메모리를 유지하며, 테스트 시점에 복잡한 툴체인을 강력하게 조정할 수 있는 코딩 에이전트가 필요합니다. 기존의 오픈소스 코딩 에이전트는 투명성을 제공하지만 이러한 산업 규모의 워크로드로 확장하기에는 종종 부족한 성능을 보입니다. 반면, 독점 코딩 에이전트는 강력한 실용적 성능을 제공하지만 확장성, 해석 가능성, 제어 가능성이 제한적입니다. 본 논문에서는 산업 규모로 운영될 수 있는 오픈소스 AI 소프트웨어 엔지니어인 Confucius Code Agent(CCA)를 제시합니다. CCA는 상호 보완적인 세 가지 관점인 에이전트 경험(AX), 사용자 경험(UX), 개발자 경험(DX)을 중심으로 설계된 오픈소스 에이전트 개발 플랫폼인 Confucius SDK를 기반으로 구축되었습니다. 이 SDK는 장문맥 추론을 위한 계층적 작업 메모리를 갖춘 통합 오케스트레이터, 세션 간 지속 학습을 위한 영구 노트 작성 시스템, 강력한 도구 사용을 위한 모듈식 확장 모듈을 도입합니다. 더 나아가, 메타 에이전트는 빌드-테스트-개선 루프를 통해 에이전트 구성의 합성, 평가, 개선을 자동화하여 새로운 작업, 환경, 툴 스택에 대한 신속한 에이전트 개발을 가능하게 합니다. 이러한 메커니즘을 갖춘 Confucius SDK를 통해 구현된 CCA는 실제 소프트웨어 엔지니어링 작업에서 강력한 성능을 제공합니다. SWE-Bench-Pro에서 CCA는 54.3%의 최첨단 Resolve@1 성능을 달성하여 기존 코딩 에이전트 대비 크게 향상된 결과를 보여줍니다. Confucius SDK와 CCA는 함께 AI 에이전트를 위한 투명하고 확장 가능하며 재현 가능한 기반을 제공하며, 연구용 프로토타입과 상용급 시스템 간의 격차를 해소하고 산업 규모의 에이전트 개발 및 배포를 지원합니다.
English
Real-world AI software engineering demands coding agents that can reason over massive repositories, maintain durable memory across and within long sessions, and robustly coordinate complex toolchains at test time. Existing open-source coding agents provide transparency but frequently fall short when pushed to these industrial-scale workloads, while proprietary coding agents offer strong practical performance but limited extensibility, interpretability, and controllability. We present the Confucius Code Agent (CCA), an open-sourced AI software engineer that can operate at an industrial scale. CCA is built atop the Confucius SDK, an open-sourced agent development platform designed around three complementary perspectives: Agent Experience (AX), User Experience (UX), and Developer Experience (DX). The SDK introduces a unified orchestrator with hierarchical working memory for long-context reasoning, a persistent note-taking system for cross-session continual learning, and a modular extension module for robust tool use. Moreover, a meta-agent automates the synthesis, evaluation, and refinement of agent configurations through a build-test-improve loop, enabling rapid agent development on new tasks, environments, and tool stacks. Instantiated on Confucius SDK with these mechanisms, CCA delivers strong performance on real-world software engineering tasks. On SWE-Bench-Pro, CCA achieves a state-of-the-art Resolve@1 performance of 54.3%, substantially improving over prior coding agents. Together, the Confucius SDK and CCA provide a transparent, extensible, and reproducible foundation for AI agents, bridge gaps between research prototypes and production-grade systems, and support agent development and deployment at industrial scale.
PDF136February 7, 2026