Modèles à espace d'états hiérarchiques pour la modélisation continue de séquence à séquence
Hierarchical State Space Models for Continuous Sequence-to-Sequence Modeling
February 15, 2024
papers.authors: Raunaq Bhirangi, Chenyu Wang, Venkatesh Pattabiraman, Carmel Majidi, Abhinav Gupta, Tess Hellebrekers, Lerrel Pinto
cs.AI
papers.abstract
Le raisonnement à partir de séquences de données sensorielles brutes est un problème omniprésent dans des domaines allant des dispositifs médicaux à la robotique. Ces problèmes impliquent souvent l'utilisation de longues séquences de données brutes provenant de capteurs (par exemple, magnétomètres, piézorésistances) pour prédire des séquences de grandeurs physiques souhaitables (par exemple, force, mesures inertielles). Bien que les approches classiques soient puissantes pour les problèmes de prédiction localement linéaires, elles échouent souvent avec les capteurs du monde réel. Ces capteurs sont généralement non linéaires, influencés par des variables extérieures (par exemple, les vibrations) et présentent une dérive dépendante des données. Pour de nombreux problèmes, la tâche de prédiction est exacerbée par des ensembles de données étiquetés de petite taille, car l'obtention de labels de référence nécessite un équipement coûteux. Dans ce travail, nous présentons les modèles hiérarchiques à espace d'états (HiSS), une nouvelle technique conceptuellement simple pour la prédiction séquentielle continue. HiSS empile des modèles à espace d'états structurés les uns sur les autres pour créer une hiérarchie temporelle. Sur six ensembles de données de capteurs réels, allant de la prédiction d'état basée sur le tactile aux mesures inertielles basées sur l'accéléromètre, HiSS surpasse les modèles de séquence de pointe tels que les Transformers causaux, les LSTMs, S4 et Mamba d'au moins 23 % en termes d'erreur quadratique moyenne (MSE). Nos expériences indiquent en outre que HiSS montre une mise à l'échelle efficace pour les petits ensembles de données et est compatible avec les techniques de filtrage de données existantes. Le code, les ensembles de données et les vidéos sont disponibles sur https://hiss-csp.github.io.
English
Reasoning from sequences of raw sensory data is a ubiquitous problem across
fields ranging from medical devices to robotics. These problems often involve
using long sequences of raw sensor data (e.g. magnetometers, piezoresistors) to
predict sequences of desirable physical quantities (e.g. force, inertial
measurements). While classical approaches are powerful for locally-linear
prediction problems, they often fall short when using real-world sensors. These
sensors are typically non-linear, are affected by extraneous variables (e.g.
vibration), and exhibit data-dependent drift. For many problems, the prediction
task is exacerbated by small labeled datasets since obtaining ground-truth
labels requires expensive equipment. In this work, we present Hierarchical
State-Space Models (HiSS), a conceptually simple, new technique for continuous
sequential prediction. HiSS stacks structured state-space models on top of each
other to create a temporal hierarchy. Across six real-world sensor datasets,
from tactile-based state prediction to accelerometer-based inertial
measurement, HiSS outperforms state-of-the-art sequence models such as causal
Transformers, LSTMs, S4, and Mamba by at least 23% on MSE. Our experiments
further indicate that HiSS demonstrates efficient scaling to smaller datasets
and is compatible with existing data-filtering techniques. Code, datasets and
videos can be found on https://hiss-csp.github.io.