ChatPaper.aiChatPaper

파일그램: 파일 시스템 행동 추적에 기반한 에이전트 개인화 구현

FileGram: Grounding Agent Personalization in File-System Behavioral Traces

April 6, 2026
저자: Shuai Liu, Shulin Tian, Kairui Hu, Yuhao Dong, Zhe Yang, Bo Li, Jingkang Yang, Chen Change Loy, Ziwei Liu
cs.AI

초록

로컬 파일 시스템 내에서 협업하는 AI 에이전트는 인간-AI 상호작용의 새로운 패러다임으로 빠르게 부상하고 있으나, 엄격한 개인정보 보호 장벽과 다중 모드 현실 세계 흔적의 공동 수집 어려움으로 인해 확장 가능한 훈련 및 평가가 제한되어 효과적인 개인화는 심각한 데이터 제약에 직면해 있다. 또한 기존 방법론은 상호작용 중심에 머물며 파일 시스템 운영 내 밀집된 행동 흔적을 간과하고 있다. 이러한 격차를 해결하기 위해 우리는 파일 시스템 행동 흔적에 기반한 에이전트 메모리 및 개인화 체계를 구축하는 포괄적 프레임워크인 FileGram을 제안한다. FileGram은 세 가지 핵심 구성요소로 이루어진다: (1) 현실적 워크플로를 시뮬레이션하고 세분화된 다중 모드 행동 시퀀스를 대규모로 생성하는 확장 가능한 페르소나 기반 데이터 엔진인 FileGramEngine; (2) 프로필 재구성, 흔적 분리, 페르소나 드리프트 감지, 다중 모드 기반 평가를 위해 파일 시스템 행동 흔적에 근거한 진단적 벤치마크 FileGramBench; (3) 대화 요약이 아닌 원자적 행동과 콘텐츠 변화로부터 직접 사용자 프로필을 구축하며, 이러한 흔적을 절차적, 의미적, 에피소드적 채널로 인코딩하고 쿼리 시간 추상화를 수행하는 하향식 메모리 아키텍처 FileGramOS. 대규모 실험을 통해 FileGramBench는 최첨단 메모리 시스템에게도 여전히 도전적인 과제이며 FileGramEngine과 FileGramOS는 효과적임을 입증하였다. 본 프레임워크를 오픈소스로 공개함으로써 개인화된 메모리 중심 파일 시스템 에이전트에 대한 향후 연구를 지원하고자 한다.
English
Coworking AI agents operating within local file systems are rapidly emerging as a paradigm in human-AI interaction; however, effective personalization remains limited by severe data constraints, as strict privacy barriers and the difficulty of jointly collecting multimodal real-world traces prevent scalable training and evaluation, and existing methods remain interaction-centric while overlooking dense behavioral traces in file-system operations; to address this gap, we propose FileGram, a comprehensive framework that grounds agent memory and personalization in file-system behavioral traces, comprising three core components: (1) FileGramEngine, a scalable persona-driven data engine that simulates realistic workflows and generates fine-grained multimodal action sequences at scale; (2) FileGramBench, a diagnostic benchmark grounded in file-system behavioral traces for evaluating memory systems on profile reconstruction, trace disentanglement, persona drift detection, and multimodal grounding; and (3) FileGramOS, a bottom-up memory architecture that builds user profiles directly from atomic actions and content deltas rather than dialogue summaries, encoding these traces into procedural, semantic, and episodic channels with query-time abstraction; extensive experiments show that FileGramBench remains challenging for state-of-the-art memory systems and that FileGramEngine and FileGramOS are effective, and by open-sourcing the framework, we hope to support future research on personalized memory-centric file-system agents.
PDF250April 8, 2026