ClawKeeper: Umfassender Sicherheitsschutz für OpenClaw-Agenten durch Fähigkeiten, Plugins und Watcher
ClawKeeper: Comprehensive Safety Protection for OpenClaw Agents Through Skills, Plugins, and Watchers
March 25, 2026
Autoren: Songyang Liu, Chaozhuo Li, Chenxu Wang, Jinyu Hou, Zejian Chen, Litian Zhang, Zheng Liu, Qiwei Ye, Yiming Hei, Xi Zhang, Zhongyuan Wang
cs.AI
Zusammenfassung
OpenClaw hat sich schnell als führende Open-Source-Laufzeitumgebung für autonome Agenten etabliert und bietet leistungsstarke Funktionen wie Tool-Integration, lokalen Dateizugriff und die Ausführung von Shell-Befehlen. Diese weitreichenden Betriebsprivilegien führen jedoch zu kritischen Sicherheitslücken, wodurch sich Modellfehler in konkrete Systembedrohungen wie die Offenlegung sensibler Daten, Rechteeskalation und die Ausführung bösartiger Drittanbieter-Skills verwandeln können. Bestehende Sicherheitsmaßnahmen für das OpenClaw-Ökosystem sind nach wie vor stark fragmentiert und behandeln nur isolierte Phasen des Agenten-Lebenszyklus, anstatt einen ganzheitlichen Schutz zu bieten. Um diese Lücke zu schließen, präsentieren wir ClawKeeper, ein Echtzeit-Sicherheitsframework, das mehrdimensionale Schutzmechanismen über drei komplementäre Architekturebenen integriert. (1) Skill-basierter Schutz operiert auf Befehlsebene, injiziert strukturierte Sicherheitsrichtlinien direkt in den Agentenkontext und erzwingt umgebungsspezifische Beschränkungen sowie plattformübergreifende Grenzen. (2) Plugin-basierter Schutz fungiert als internaler Laufzeit-Erzwingungsmechanismus, bietet Konfigurationshärtung, proaktive Bedrohungserkennung und kontinuierliche Verhaltensüberwachung throughout der gesamten Ausführungspipeline. (3) Watcher-basierter Schutz führt eine neuartige, entkoppelte Systemebene als Sicherheits-Middleware ein, die die Zustandsentwicklung des Agenten kontinuierlich verifiziert. Es ermöglicht Echtzeit-Eingriffe in die Ausführung ohne Kopplung an die interne Logik des Agenten und unterstützt Operationen wie das Stoppen riskanter Aktionen oder das Erzwingen menschlicher Bestätigung. Wir sind der Ansicht, dass dieses Watcher-Paradigma ein großes Potenzial besitzt, als grundlegende Bausteinkomponente für die Absicherung von autonomen Agentensystemen der nächsten Generation zu dienen. Umfangreiche qualitative und quantitative Evaluationen demonstrieren die Wirksamkeit und Robustheit von ClawKeeper in verschiedenen Bedrohungsszenarien. Wir veröffentlichen unseren Code.
English
OpenClaw has rapidly established itself as a leading open-source autonomous agent runtime, offering powerful capabilities including tool integration, local file access, and shell command execution. However, these broad operational privileges introduce critical security vulnerabilities, transforming model errors into tangible system-level threats such as sensitive data leakage, privilege escalation, and malicious third-party skill execution. Existing security measures for the OpenClaw ecosystem remain highly fragmented, addressing only isolated stages of the agent lifecycle rather than providing holistic protection. To bridge this gap, we present ClawKeeper, a real-time security framework that integrates multi-dimensional protection mechanisms across three complementary architectural layers. (1) Skill-based protection operates at the instruction level, injecting structured security policies directly into the agent context to enforce environment-specific constraints and cross-platform boundaries. (2) Plugin-based protection serves as an internal runtime enforcer, providing configuration hardening, proactive threat detection, and continuous behavioral monitoring throughout the execution pipeline. (3) Watcher-based protection introduces a novel, decoupled system-level security middleware that continuously verifies agent state evolution. It enables real-time execution intervention without coupling to the agent's internal logic, supporting operations such as halting high-risk actions or enforcing human confirmation. We argue that this Watcher paradigm holds strong potential to serve as a foundational building block for securing next-generation autonomous agent systems. Extensive qualitative and quantitative evaluations demonstrate the effectiveness and robustness of ClawKeeper across diverse threat scenarios. We release our code.