ChatPaper.aiChatPaper

Modèles à espace d'états hiérarchiques pour la modélisation continue de séquence à séquence

Hierarchical State Space Models for Continuous Sequence-to-Sequence Modeling

February 15, 2024
papers.authors: Raunaq Bhirangi, Chenyu Wang, Venkatesh Pattabiraman, Carmel Majidi, Abhinav Gupta, Tess Hellebrekers, Lerrel Pinto
cs.AI

papers.abstract

Le raisonnement à partir de séquences de données sensorielles brutes est un problème omniprésent dans des domaines allant des dispositifs médicaux à la robotique. Ces problèmes impliquent souvent l'utilisation de longues séquences de données brutes provenant de capteurs (par exemple, magnétomètres, piézorésistances) pour prédire des séquences de grandeurs physiques souhaitables (par exemple, force, mesures inertielles). Bien que les approches classiques soient puissantes pour les problèmes de prédiction localement linéaires, elles échouent souvent avec les capteurs du monde réel. Ces capteurs sont généralement non linéaires, influencés par des variables extérieures (par exemple, les vibrations) et présentent une dérive dépendante des données. Pour de nombreux problèmes, la tâche de prédiction est exacerbée par des ensembles de données étiquetés de petite taille, car l'obtention de labels de référence nécessite un équipement coûteux. Dans ce travail, nous présentons les modèles hiérarchiques à espace d'états (HiSS), une nouvelle technique conceptuellement simple pour la prédiction séquentielle continue. HiSS empile des modèles à espace d'états structurés les uns sur les autres pour créer une hiérarchie temporelle. Sur six ensembles de données de capteurs réels, allant de la prédiction d'état basée sur le tactile aux mesures inertielles basées sur l'accéléromètre, HiSS surpasse les modèles de séquence de pointe tels que les Transformers causaux, les LSTMs, S4 et Mamba d'au moins 23 % en termes d'erreur quadratique moyenne (MSE). Nos expériences indiquent en outre que HiSS montre une mise à l'échelle efficace pour les petits ensembles de données et est compatible avec les techniques de filtrage de données existantes. Le code, les ensembles de données et les vidéos sont disponibles sur https://hiss-csp.github.io.
English
Reasoning from sequences of raw sensory data is a ubiquitous problem across fields ranging from medical devices to robotics. These problems often involve using long sequences of raw sensor data (e.g. magnetometers, piezoresistors) to predict sequences of desirable physical quantities (e.g. force, inertial measurements). While classical approaches are powerful for locally-linear prediction problems, they often fall short when using real-world sensors. These sensors are typically non-linear, are affected by extraneous variables (e.g. vibration), and exhibit data-dependent drift. For many problems, the prediction task is exacerbated by small labeled datasets since obtaining ground-truth labels requires expensive equipment. In this work, we present Hierarchical State-Space Models (HiSS), a conceptually simple, new technique for continuous sequential prediction. HiSS stacks structured state-space models on top of each other to create a temporal hierarchy. Across six real-world sensor datasets, from tactile-based state prediction to accelerometer-based inertial measurement, HiSS outperforms state-of-the-art sequence models such as causal Transformers, LSTMs, S4, and Mamba by at least 23% on MSE. Our experiments further indicate that HiSS demonstrates efficient scaling to smaller datasets and is compatible with existing data-filtering techniques. Code, datasets and videos can be found on https://hiss-csp.github.io.
PDF141December 15, 2024