ChatPaper.aiChatPaper

Sema Code: AI 코딩 에이전트를 프로그래밍 가능하고 임베딩 가능한 인프라로 분리하기

Sema Code: Decoupling AI Coding Agents into Programmable, Embeddable Infrastructure

April 13, 2026
저자: Huacan Wang, Jie Zhou, Ningyan Zhu, Shuo Zhang, Feiyu Chen, Jiarou Wu, Ge Chen, Chen Liu, Wangyi Chen, Xiaofeng Mou, Yi Xu
cs.AI

초록

AI 코딩 에이전트는 개발자 워크플로우의 중심이 되었지만, 기존 모든 솔루션은 CLI, IDE 플러그인, 웹 애플리케이션 등 특정 전달 형태에 추론 기능을 고정시켜왔습니다. 이러한 한계는 기업이 이기종 엔지니어링 환경에서 해당 기능을 재사용하려고 시도할 때 시스템적 장벽을 생성합니다. 이 문제를 해결하기 위해 우리는 임베디드, 플러그 가능, 프레임워크 퍼스트 원칙에 기반한 오픈 AI 코딩 프레임워크인 Sema Code를 제시합니다. Sema Code는 코어 에이전트 엔진을 모든 클라이언트 계층으로부터 완전히 분리하여 어떠한 런타임에서도 프로그래밍 방식으로 구동할 수 있는 독립형 npm 라이브러리로 공개합니다. 이 아키텍처를 기반으로 우리는 8가지 핵심 메커니즘을 설계했습니다: 다중 테넌트 엔진 격리, 안전한 세션 재구성을 지원하는 FIFO 입력 큐잉, 적응형 컨텍스트 압축, 다중 에이전트 협업 스케줄링, 지능형 Todo 기반 프로세스 관리, 4계층 비동기 권한 제어, MCP, Skills, Plugins를 아우르는 3계층 생태계 통합, 그리고 실행과 관찰 권한이 분리된 백그라운드 태스크 프레임워크입니다. 이러한 메커니즘들은 복잡한 에이전트 엔진을 공유 가능하고 프로그래밍 가능한 코어로 변환하는 엔지니어링 과제를 종합적으로 해결합니다. 동일한 Sema Core 엔진이 VSCode 확장 프로그램과 Telegram 및 Feishu와 같은 플랫폼 간 에이전트 상호작용을 통합하는 다중 채널 메시징 게이트웨이(SemaClaw로 명명)를 동시에 구동하는 것은 그 아키텍처 다양성을 입증합니다. 이들은 동일한 추론 커널을 공유하되 클라이언트 계층에서만 차이가 나는 근본적으로 다른 두 가지 제품 형태를 대표합니다.
English
AI coding agents have become central to developer workflows, yet every existing solution locks its reasoning capabilities within a specific delivery form, such as a CLI, IDE plugin, or web application. This limitation creates systemic barriers when enterprises attempt to reuse these capabilities across heterogeneous engineering environments. To address this challenge, we present Sema Code, an open AI coding framework built on the principle of being embeddable, pluggable, and framework-first. Sema Code completely decouples the core agent engine from all client layers, publishing it as a standalone npm library that any runtime can drive programmatically. Built around this architecture, we designed eight key mechanisms: multi-tenant engine isolation, FIFO input queuing with safe session reconstruction, adaptive context compression, multi-agent collaborative scheduling, intelligent Todo-based process management, four-layer asynchronous permission control, three-tier ecosystem integration spanning MCP, Skills, and Plugins, and a background task framework with separated execution and observation privileges. These mechanisms collectively address the engineering challenges of transforming a complex agent engine into a shared, programmable core. Demonstrating its architectural versatility, the same Sema Core engine simultaneously powers a VSCode extension and a multi-channel messaging gateway, which we name SemaClaw, to unify agent interactions across platforms such as Telegram and Feishu. These represent two fundamentally different product forms sharing an identical reasoning kernel, differing only at the client layer.
PDF181April 17, 2026