ClawKeeper: Proteção de Segurança Abrangente para Agentes OpenClaw por meio de Habilidades, Plugins e Observadores

Resumo

O OpenClaw rapidamente se estabeleceu como um runtime de agente autónomo de código aberto líder, oferecendo capacidades poderosas que incluem integração de ferramentas, acesso a ficheiros locais e execução de comandos de shell. No entanto, estes amplos privilégios operacionais introduzem vulnerabilidades de segurança críticas, transformando erros do modelo em ameaças tangíveis a nível de sistema, como fugas de dados sensíveis, escalada de privilégios e execução maliciosa de *skills* de terceiros. As medidas de segurança existentes para o ecossistema OpenClaw permanecem altamente fragmentadas, abordando apenas etapas isoladas do ciclo de vida do agente, em vez de fornecer uma proteção holística. Para colmatar esta lacuna, apresentamos o ClawKeeper, um quadro de segurança em tempo real que integra mecanismos de proteção multidimensionais em três camadas arquitetónicas complementares. (1) A proteção baseada em *skills* opera ao nível da instrução, injetando políticas de segurança estruturadas diretamente no contexto do agente para impor restrições específicas do ambiente e atravessar fronteiras entre plataformas. (2) A proteção baseada em *plugins* atua como um fiscal interno em tempo de execução, fornecendo reforço de configuração, deteção proativa de ameaças e monitorização comportamental contínua em todo o *pipeline* de execução. (3) A proteção baseada em *Watchers* introduz um *middleware* de segurança a nível de sistema, desacoplado e inovador, que verifica continuamente a evolução do estado do agente. Permite a intervenção em tempo real na execução sem acoplamento à lógica interna do agente, suportando operações como a paragem de ações de alto risco ou a imposição de confirmação humana. Argumentamos que este paradigma de *Watcher* tem um forte potencial para servir como um bloco de construção fundamental para a segurança de sistemas de agentes autónomos de próxima geração. Avaliações qualitativas e quantitativas extensivas demonstram a eficácia e robustez do ClawKeeper em diversos cenários de ameaça. Disponibilizamos o nosso código.

English

OpenClaw has rapidly established itself as a leading open-source autonomous agent runtime, offering powerful capabilities including tool integration, local file access, and shell command execution. However, these broad operational privileges introduce critical security vulnerabilities, transforming model errors into tangible system-level threats such as sensitive data leakage, privilege escalation, and malicious third-party skill execution. Existing security measures for the OpenClaw ecosystem remain highly fragmented, addressing only isolated stages of the agent lifecycle rather than providing holistic protection. To bridge this gap, we present ClawKeeper, a real-time security framework that integrates multi-dimensional protection mechanisms across three complementary architectural layers. (1) Skill-based protection operates at the instruction level, injecting structured security policies directly into the agent context to enforce environment-specific constraints and cross-platform boundaries. (2) Plugin-based protection serves as an internal runtime enforcer, providing configuration hardening, proactive threat detection, and continuous behavioral monitoring throughout the execution pipeline. (3) Watcher-based protection introduces a novel, decoupled system-level security middleware that continuously verifies agent state evolution. It enables real-time execution intervention without coupling to the agent's internal logic, supporting operations such as halting high-risk actions or enforcing human confirmation. We argue that this Watcher paradigm holds strong potential to serve as a foundational building block for securing next-generation autonomous agent systems. Extensive qualitative and quantitative evaluations demonstrate the effectiveness and robustness of ClawKeeper across diverse threat scenarios. We release our code.