ClawKeeper: OpenClaw 에이전트를 위한 기술, 플러그인, 감시자를 통한 포괄적 안전 보호
ClawKeeper: Comprehensive Safety Protection for OpenClaw Agents Through Skills, Plugins, and Watchers
March 25, 2026
저자: Songyang Liu, Chaozhuo Li, Chenxu Wang, Jinyu Hou, Zejian Chen, Litian Zhang, Zheng Liu, Qiwei Ye, Yiming Hei, Xi Zhang, Zhongyuan Wang
cs.AI
초록
OpenClaw는 도구 통합, 로컬 파일 접근, 셸 명령어 실행 등 강력한 기능을 제공하며 오픈소스 자율 에이전트 런타임 분야에서 빠르게 선도적 위치를 확립해왔습니다. 그러나 이러한 광범위한 운영 권한은 중요한 보안 취약점을 초래하여, 모델 오류를 민감 데이터 유출, 권한 상승, 악성 제3자 스킬 실행 등 실제 시스템 수준의 위협으로 전환시키고 있습니다. OpenCl� 생태계의 기존 보안 조치는 매우 파편화되어 있어 에이전트 생애주기의 개별 단계만을 대상으로 할 뿐 종합적인 보호를 제공하지 못하고 있습니다. 이러한 격차를 해소하기 위해 본 논문은 상호 보완적인 세 가지 아키텍처 계층에 걸쳐 다차원적 보호 메커니즘을 통합한 실시간 보안 프레임워크인 ClawKeeper를 제안합니다. (1) 스킬 기반 보호는 명령어 수준에서 작동하여 구조화된 보안 정책을 에이전트 컨텍스트에 직접 주입함으로써 환경 특화적 제약 조건과 크로스 플랫폼 경계를 적용합니다. (2) 플러그인 기반 보호는 내부 런타임 집행자 역할을 수행하며, 실행 파이프라인 전반에 걸쳐 구성 강화, 사전 위협 탐지, 지속적 행동 모니터링을 제공합니다. (3) 감시자(Watcher) 기반 보호는 에이전트 상태 변화를 지속적으로 검증하는 새로운 분리형 시스템 수준 보안 미들웨어를 도입합니다. 이는 에이전트 내부 논리에 결합되지 않으면서 고위험 행동 중단 또는 인간 확인 강제 실행과 같은 개입을 실시간으로 가능하게 합니다. 저희는 이 감시자 패러다임이 차세대 자율 에이전트 시스템 보안을 위한 기초 구성 요소로서 강력한 잠재력을 지닌다고 주장합니다. 다양한 위협 시나리오에 대한 포괄적 정성 및 정량 평가를 통해 ClawKeeper의 효과성과 강건성이 입증되었으며, 코드를 공개합니다.
English
OpenClaw has rapidly established itself as a leading open-source autonomous agent runtime, offering powerful capabilities including tool integration, local file access, and shell command execution. However, these broad operational privileges introduce critical security vulnerabilities, transforming model errors into tangible system-level threats such as sensitive data leakage, privilege escalation, and malicious third-party skill execution. Existing security measures for the OpenClaw ecosystem remain highly fragmented, addressing only isolated stages of the agent lifecycle rather than providing holistic protection. To bridge this gap, we present ClawKeeper, a real-time security framework that integrates multi-dimensional protection mechanisms across three complementary architectural layers. (1) Skill-based protection operates at the instruction level, injecting structured security policies directly into the agent context to enforce environment-specific constraints and cross-platform boundaries. (2) Plugin-based protection serves as an internal runtime enforcer, providing configuration hardening, proactive threat detection, and continuous behavioral monitoring throughout the execution pipeline. (3) Watcher-based protection introduces a novel, decoupled system-level security middleware that continuously verifies agent state evolution. It enables real-time execution intervention without coupling to the agent's internal logic, supporting operations such as halting high-risk actions or enforcing human confirmation. We argue that this Watcher paradigm holds strong potential to serve as a foundational building block for securing next-generation autonomous agent systems. Extensive qualitative and quantitative evaluations demonstrate the effectiveness and robustness of ClawKeeper across diverse threat scenarios. We release our code.