ChatPaper.aiChatPaper

ZARA: Анализ временных рядов движения с нулевым обучением через агентов на основе языковых моделей с использованием знаний и поиска

ZARA: Zero-shot Motion Time-Series Analysis via Knowledge and Retrieval Driven LLM Agents

August 6, 2025
Авторы: Zechen Li, Baiyu Chen, Hao Xue, Flora D. Salim
cs.AI

Аннотация

Временные ряды данных с датчиков движения играют ключевую роль в распознавании человеческой активности (HAR), находя применение в здравоохранении, спорте и умных устройствах. Однако существующие методы обучаются на фиксированных наборах активностей и требуют дорогостоящего переобучения при появлении новых поведенческих паттернов или конфигураций датчиков. Недавние попытки использования крупных языковых моделей (LLM) для HAR, обычно путем преобразования сигналов в текст или изображения, страдают от ограниченной точности и отсутствия проверяемой интерпретируемости. Мы предлагаем ZARA — первую агентно-ориентированную платформу для объяснимого HAR с нулевым обучением, работающую непосредственно с сырыми временными рядами движения. ZARA интегрирует автоматически создаваемую базу знаний о парных признаках, которая фиксирует различительные статистики для каждой пары активностей, модуль извлечения данных с нескольких датчиков, который предоставляет релевантные доказательства, и иерархический агентный конвейер, который направляет LLM для итеративного выбора признаков, использования этих доказательств и генерации как предсказаний активности, так и объяснений на естественном языке. ZARA обеспечивает гибкое и интерпретируемое HAR без необходимости тонкой настройки или специфичных для задачи классификаторов. Экстенсивные эксперименты на 8 бенчмарках HAR показывают, что ZARA достигает наилучших результатов с нулевым обучением, предоставляя четкие обоснования и превосходя сильнейшие базовые методы в 2.53 раза по макро F1. Абляционные исследования дополнительно подтверждают необходимость каждого модуля, что делает ZARA перспективным шагом к надежному и готовому к использованию анализу временных рядов движения. Наши коды доступны по адресу https://github.com/zechenli03/ZARA.
English
Motion sensor time-series are central to human activity recognition (HAR), with applications in health, sports, and smart devices. However, existing methods are trained for fixed activity sets and require costly retraining when new behaviours or sensor setups appear. Recent attempts to use large language models (LLMs) for HAR, typically by converting signals into text or images, suffer from limited accuracy and lack verifiable interpretability. We propose ZARA, the first agent-based framework for zero-shot, explainable HAR directly from raw motion time-series. ZARA integrates an automatically derived pair-wise feature knowledge base that captures discriminative statistics for every activity pair, a multi-sensor retrieval module that surfaces relevant evidence, and a hierarchical agent pipeline that guides the LLM to iteratively select features, draw on this evidence, and produce both activity predictions and natural-language explanations. ZARA enables flexible and interpretable HAR without any fine-tuning or task-specific classifiers. Extensive experiments on 8 HAR benchmarks show that ZARA achieves SOTA zero-shot performance, delivering clear reasoning while exceeding the strongest baselines by 2.53x in macro F1. Ablation studies further confirm the necessity of each module, marking ZARA as a promising step toward trustworthy, plug-and-play motion time-series analysis. Our codes are available at https://github.com/zechenli03/ZARA.
PDF11August 20, 2025