ClawKeeper: Protezione Sicurezza Completa per Agenti OpenClaw tramite Abilità, Plugin e Watcher
ClawKeeper: Comprehensive Safety Protection for OpenClaw Agents Through Skills, Plugins, and Watchers
March 25, 2026
Autori: Songyang Liu, Chaozhuo Li, Chenxu Wang, Jinyu Hou, Zejian Chen, Litian Zhang, Zheng Liu, Qiwei Ye, Yiming Hei, Xi Zhang, Zhongyuan Wang
cs.AI
Abstract
OpenClaw si è rapidamente affermato come un runtime per agenti autonomi open-source di primo piano, offrendo potenti capacità tra cui integrazione di strumenti, accesso ai file locali ed esecuzione di comandi shell. Tuttavia, questi ampi privilegi operativi introducono critiche vulnerabilità di sicurezza, trasformando gli errori del modello in minacce tangibili a livello di sistema come la fuoriuscita di dati sensibili, l'elevazione dei privilegi e l'esecuzione malevola di skill di terze parti. Le misure di sicurezza esistenti per l'ecosistema OpenClaw rimangono altamente frammentate, affrontando solo stadi isolati del ciclo di vita dell'agente piuttosto che fornire una protezione olistica. Per colmare questa lacuna, presentiamo ClawKeeper, un framework di sicurezza in tempo reale che integra meccanismi di protezione multidimensionali su tre livelli architetturali complementari. (1) La protezione basata su skill opera a livello di istruzione, iniettando politiche di sicurezza strutturate direttamente nel contesto dell'agente per imporre vincoli specifici dell'ambiente e attraversare i confini delle piattaforme. (2) La protezione basata su plugin funge da meccanismo di enforcement interno al runtime, fornendo irrobustimento della configurazione, rilevamento proattivo delle minacce e monitoraggio comportamentale continuo throughout la pipeline di esecuzione. (3) La protezione basata su Watcher introduce un middleware di sicurezza a livello di sistema, disaccoppiato e innovativo, che verifica continuamente l'evoluzione dello stato dell'agente. Consente un'intervento in tempo reale sull'esecuzione senza accoppiamento con la logica interna dell'agente, supportando operazioni come l'arresto di azioni ad alto rischio o l'imposizione di conferma umana. Sosteniamo che questo paradigma Watcher abbia un forte potenziale per servire come componente fondamentale per la protezione dei sistemi di agenti autonomi di prossima generazione. Estese valutazioni qualitative e quantitative dimostrano l'efficacia e la robustezza di ClawKeeper in vari scenari di minaccia. Rilasciamo il nostro codice.
English
OpenClaw has rapidly established itself as a leading open-source autonomous agent runtime, offering powerful capabilities including tool integration, local file access, and shell command execution. However, these broad operational privileges introduce critical security vulnerabilities, transforming model errors into tangible system-level threats such as sensitive data leakage, privilege escalation, and malicious third-party skill execution. Existing security measures for the OpenClaw ecosystem remain highly fragmented, addressing only isolated stages of the agent lifecycle rather than providing holistic protection. To bridge this gap, we present ClawKeeper, a real-time security framework that integrates multi-dimensional protection mechanisms across three complementary architectural layers. (1) Skill-based protection operates at the instruction level, injecting structured security policies directly into the agent context to enforce environment-specific constraints and cross-platform boundaries. (2) Plugin-based protection serves as an internal runtime enforcer, providing configuration hardening, proactive threat detection, and continuous behavioral monitoring throughout the execution pipeline. (3) Watcher-based protection introduces a novel, decoupled system-level security middleware that continuously verifies agent state evolution. It enables real-time execution intervention without coupling to the agent's internal logic, supporting operations such as halting high-risk actions or enforcing human confirmation. We argue that this Watcher paradigm holds strong potential to serve as a foundational building block for securing next-generation autonomous agent systems. Extensive qualitative and quantitative evaluations demonstrate the effectiveness and robustness of ClawKeeper across diverse threat scenarios. We release our code.