ChatPaper.aiChatPaper

Sema Code: Entkopplung von KI-Codierungsagenten in programmierbare, einbettbare Infrastruktur

Sema Code: Decoupling AI Coding Agents into Programmable, Embeddable Infrastructure

April 13, 2026
Autoren: Huacan Wang, Jie Zhou, Ningyan Zhu, Shuo Zhang, Feiyu Chen, Jiarou Wu, Ge Chen, Chen Liu, Wangyi Chen, Xiaofeng Mou, Yi Xu
cs.AI

Zusammenfassung

KI-Code-Agenten sind zu einem zentralen Bestandteil von Entwickler-Workflows geworden, doch jede bestehende Lösung schränkt ihre Fähigkeiten zur Wissensverarbeitung in eine bestimmte Bereitstellungsform ein, wie etwa eine CLI, ein IDE-Plugin oder eine Webanwendung. Diese Einschränkung erzeugt systemische Barrieren, wenn Unternehmen versuchen, diese Fähigkeiten über heterogene Entwicklungsumgebungen hinweg wiederzuverwenden. Um diese Herausforderung zu bewältigen, stellen wir Sema Code vor, ein offenes KI-Code-Framework, das auf dem Prinzip der Einbettbarkeit, Erweiterbarkeit und des Framework-First-Ansatzes aufbaut. Sema Code entkoppelt die Kern-Agenten-Engine vollständig von allen Client-Schichten und veröffentlicht sie als eigenständige npm-Bibliothek, die jede Laufzeitumgebung programmgesteuert ansteuern kann. Rund um diese Architektur haben wir acht Schlüsselmechanismen entwickelt: Multi-Tenant-Engine-Isolierung, FIFO-Eingabewarteschlangen mit sicherer Sitzungswiederherstellung, adaptive Kontextkompression, Multi-Agenten-kollaborative Planung, intelligentes Todo-basiertes Prozessmanagement, vierstufige asynchrone Berechtigungskontrolle, dreistufige Ökosystem-Integration (umfassend MCP, Skills und Plugins) sowie ein Framework für Hintergrundaufgaben mit getrennten Ausführungs- und Beobachtungsberechtigungen. Diese Mechanismen adressieren gemeinsam die ingenieurtechnischen Herausforderungen bei der Transformation einer komplexen Agenten-Engine in einen gemeinsamen, programmierbaren Kern. Zur Demonstration seiner architektonischen Vielseitigkeit treibt die gleiche Sema Core-Engine gleichzeitig eine VSCode-Erweiterung und ein Multi-Channel-Nachrichtengateway an, das wir SemaClaw nennen, um Agenten-Interaktionen plattformübergreifend – etwa über Telegram und Feishu – zu vereinheitlichen. Diese repräsentieren zwei grundlegend verschiedene Produktformen, die einen identischen Verarbeitungskern teilen und sich nur in der Client-Schicht unterscheiden.
English
AI coding agents have become central to developer workflows, yet every existing solution locks its reasoning capabilities within a specific delivery form, such as a CLI, IDE plugin, or web application. This limitation creates systemic barriers when enterprises attempt to reuse these capabilities across heterogeneous engineering environments. To address this challenge, we present Sema Code, an open AI coding framework built on the principle of being embeddable, pluggable, and framework-first. Sema Code completely decouples the core agent engine from all client layers, publishing it as a standalone npm library that any runtime can drive programmatically. Built around this architecture, we designed eight key mechanisms: multi-tenant engine isolation, FIFO input queuing with safe session reconstruction, adaptive context compression, multi-agent collaborative scheduling, intelligent Todo-based process management, four-layer asynchronous permission control, three-tier ecosystem integration spanning MCP, Skills, and Plugins, and a background task framework with separated execution and observation privileges. These mechanisms collectively address the engineering challenges of transforming a complex agent engine into a shared, programmable core. Demonstrating its architectural versatility, the same Sema Core engine simultaneously powers a VSCode extension and a multi-channel messaging gateway, which we name SemaClaw, to unify agent interactions across platforms such as Telegram and Feishu. These represent two fundamentally different product forms sharing an identical reasoning kernel, differing only at the client layer.
PDF181April 17, 2026