ClawKeeper: Protección Integral de Seguridad para Agentes OpenClaw mediante Habilidades, Plugins y Vigilantes
ClawKeeper: Comprehensive Safety Protection for OpenClaw Agents Through Skills, Plugins, and Watchers
March 25, 2026
Autores: Songyang Liu, Chaozhuo Li, Chenxu Wang, Jinyu Hou, Zejian Chen, Litian Zhang, Zheng Liu, Qiwei Ye, Yiming Hei, Xi Zhang, Zhongyuan Wang
cs.AI
Resumen
OpenClaw se ha establecido rápidamente como un entorno de ejecución (runtime) de agentes autónomos de código abierto líder, que ofrece capacidades potentes que incluyen la integración de herramientas, el acceso a archivos locales y la ejecución de comandos de shell. Sin embargo, estos amplios privilegios operativos introducen vulnerabilidades de seguridad críticas, transformando los errores del modelo en amenazas tangibles a nivel del sistema, como la filtración de datos sensibles, la escalada de privilegios y la ejecución maliciosa de habilidades (skills) de terceros. Las medidas de seguridad existentes para el ecosistema OpenClaw siguen estando muy fragmentadas, abordando solo etapas aisladas del ciclo de vida del agente en lugar de proporcionar una protección holística. Para cerrar esta brecha, presentamos ClawKeeper, un marco de seguridad en tiempo real que integra mecanismos de protección multidimensionales en tres capas arquitectónicas complementarias. (1) La protección basada en habilidades opera a nivel de instrucción, inyectando políticas de seguridad estructuradas directamente en el contexto del agente para hacer cumplir restricciones específicas del entorno y cruzar límites entre plataformas. (2) La protección basada en complementos (plugins) actúa como un mecanismo de control interno en tiempo de ejecución, proporcionando endurecimiento de la configuración, detección proactiva de amenazas y monitorización continua del comportamiento a lo largo de la canalización de ejecución. (3) La protección basada en observadores (watchers) introduce un middleware de seguridad a nivel del sistema novedoso y desacoplado que verifica continuamente la evolución del estado del agente. Permite la intervención en la ejecución en tiempo real sin acoplarse a la lógica interna del agente, soportando operaciones como detener acciones de alto riesgo o exigir confirmación humana. Sostenemos que este paradigma de Observador tiene un gran potencial para servir como un componente fundamental para asegurar los sistemas de agentes autónomos de próxima generación. Evaluaciones cualitativas y cuantitativas exhaustivas demuestran la efectividad y robustez de ClawKeeper en diversos escenarios de amenazas. Liberamos nuestro código.
English
OpenClaw has rapidly established itself as a leading open-source autonomous agent runtime, offering powerful capabilities including tool integration, local file access, and shell command execution. However, these broad operational privileges introduce critical security vulnerabilities, transforming model errors into tangible system-level threats such as sensitive data leakage, privilege escalation, and malicious third-party skill execution. Existing security measures for the OpenClaw ecosystem remain highly fragmented, addressing only isolated stages of the agent lifecycle rather than providing holistic protection. To bridge this gap, we present ClawKeeper, a real-time security framework that integrates multi-dimensional protection mechanisms across three complementary architectural layers. (1) Skill-based protection operates at the instruction level, injecting structured security policies directly into the agent context to enforce environment-specific constraints and cross-platform boundaries. (2) Plugin-based protection serves as an internal runtime enforcer, providing configuration hardening, proactive threat detection, and continuous behavioral monitoring throughout the execution pipeline. (3) Watcher-based protection introduces a novel, decoupled system-level security middleware that continuously verifies agent state evolution. It enables real-time execution intervention without coupling to the agent's internal logic, supporting operations such as halting high-risk actions or enforcing human confirmation. We argue that this Watcher paradigm holds strong potential to serve as a foundational building block for securing next-generation autonomous agent systems. Extensive qualitative and quantitative evaluations demonstrate the effectiveness and robustness of ClawKeeper across diverse threat scenarios. We release our code.