ChatPaper.aiChatPaper

ClawKeeper: Комплексная защита OpenClaw-агентов с помощью навыков, плагинов и наблюдателей

ClawKeeper: Comprehensive Safety Protection for OpenClaw Agents Through Skills, Plugins, and Watchers

March 25, 2026
Авторы: Songyang Liu, Chaozhuo Li, Chenxu Wang, Jinyu Hou, Zejian Chen, Litian Zhang, Zheng Liu, Qiwei Ye, Yiming Hei, Xi Zhang, Zhongyuan Wang
cs.AI

Аннотация

OpenClaw быстро зарекомендовал себя как ведущая среда выполнения автономных агентов с открытым исходным кодом, предлагающая мощные возможности, включая интеграцию инструментов, локальный доступ к файлам и выполнение shell-команд. Однако эти широкие операционные привилегии создают критические уязвимости безопасности, превращая ошибки модели в реальные угрозы на уровне системы, такие как утечка конфиденциальных данных, повышение привилегий и выполнение вредоносных сторонних навыков. Существующие меры безопасности для экосистемы OpenClaw остаются сильно фрагментированными, затрагивая лишь изолированные этапы жизненного цикла агента, а не обеспечивая комплексную защиту. Чтобы устранить этот пробел, мы представляем ClawKeeper — framework безопасности реального времени, который интегрирует многомерные механизмы защиты на трех взаимодополняющих архитектурных уровнях. (1) Защита на уровне навыков работает на уровне инструкций, внедряя структурированные политики безопасности непосредственно в контекст агента для обеспечения ограничений, специфичных для среды, и пересечения платформенных границ. (2) Защита на основе плагинов служит внутренним механизмом принуждения во время выполнения, обеспечивая усиление конфигурации, проактивное обнаружение угроз и непрерывный мониторинг поведения на протяжении всего конвейера выполнения. (3) Защита на основе наблюдателя представляет собой новую, развязанную промежуточную систему безопасности на уровне системы, которая непрерывно проверяет эволюцию состояния агента. Она позволяет осуществлять вмешательство в реальном времени без привязки к внутренней логике агента, поддерживая такие операции, как остановка высокорисковых действий или принудительное подтверждение человеком. Мы утверждаем, что парадигма Наблюдателя обладает большим потенциалом для использования в качестве фундаментального строительного блока для обеспечения безопасности систем автономных агентов следующего поколения. Обширные качественные и количественные оценки демонстрируют эффективность и надежность ClawKeeper в различных сценариях угроз. Мы публикуем наш код.
English
OpenClaw has rapidly established itself as a leading open-source autonomous agent runtime, offering powerful capabilities including tool integration, local file access, and shell command execution. However, these broad operational privileges introduce critical security vulnerabilities, transforming model errors into tangible system-level threats such as sensitive data leakage, privilege escalation, and malicious third-party skill execution. Existing security measures for the OpenClaw ecosystem remain highly fragmented, addressing only isolated stages of the agent lifecycle rather than providing holistic protection. To bridge this gap, we present ClawKeeper, a real-time security framework that integrates multi-dimensional protection mechanisms across three complementary architectural layers. (1) Skill-based protection operates at the instruction level, injecting structured security policies directly into the agent context to enforce environment-specific constraints and cross-platform boundaries. (2) Plugin-based protection serves as an internal runtime enforcer, providing configuration hardening, proactive threat detection, and continuous behavioral monitoring throughout the execution pipeline. (3) Watcher-based protection introduces a novel, decoupled system-level security middleware that continuously verifies agent state evolution. It enables real-time execution intervention without coupling to the agent's internal logic, supporting operations such as halting high-risk actions or enforcing human confirmation. We argue that this Watcher paradigm holds strong potential to serve as a foundational building block for securing next-generation autonomous agent systems. Extensive qualitative and quantitative evaluations demonstrate the effectiveness and robustness of ClawKeeper across diverse threat scenarios. We release our code.
PDF1662April 3, 2026