Modelos Jerárquicos de Espacio de Estados para el Modelado Continuo de Secuencia a Secuencia
Hierarchical State Space Models for Continuous Sequence-to-Sequence Modeling
February 15, 2024
Autores: Raunaq Bhirangi, Chenyu Wang, Venkatesh Pattabiraman, Carmel Majidi, Abhinav Gupta, Tess Hellebrekers, Lerrel Pinto
cs.AI
Resumen
El razonamiento a partir de secuencias de datos sensoriales en bruto es un problema omnipresente en campos que van desde dispositivos médicos hasta robótica. Estos problemas suelen implicar el uso de secuencias largas de datos sensoriales en bruto (por ejemplo, magnetómetros, piezoresistores) para predecir secuencias de cantidades físicas deseables (por ejemplo, fuerza, mediciones inerciales). Aunque los enfoques clásicos son potentes para problemas de predicción localmente lineales, a menudo se quedan cortos cuando se utilizan sensores del mundo real. Estos sensores suelen ser no lineales, se ven afectados por variables externas (por ejemplo, vibraciones) y presentan deriva dependiente de los datos. Para muchos problemas, la tarea de predicción se ve agravada por conjuntos de datos etiquetados pequeños, ya que obtener etiquetas de referencia requiere equipos costosos. En este trabajo, presentamos los Modelos Jerárquicos de Espacio de Estados (HiSS), una técnica nueva y conceptualmente simple para la predicción secuencial continua. HiSS apila modelos estructurados de espacio de estados uno sobre otro para crear una jerarquía temporal. En seis conjuntos de datos de sensores del mundo real, desde la predicción de estado basada en táctiles hasta la medición inercial basada en acelerómetros, HiSS supera a los modelos de secuencia más avanzados, como Transformers causales, LSTMs, S4 y Mamba, en al menos un 23% en MSE. Nuestros experimentos indican además que HiSS demuestra un escalado eficiente a conjuntos de datos más pequeños y es compatible con técnicas existentes de filtrado de datos. El código, los conjuntos de datos y los videos se pueden encontrar en https://hiss-csp.github.io.
English
Reasoning from sequences of raw sensory data is a ubiquitous problem across
fields ranging from medical devices to robotics. These problems often involve
using long sequences of raw sensor data (e.g. magnetometers, piezoresistors) to
predict sequences of desirable physical quantities (e.g. force, inertial
measurements). While classical approaches are powerful for locally-linear
prediction problems, they often fall short when using real-world sensors. These
sensors are typically non-linear, are affected by extraneous variables (e.g.
vibration), and exhibit data-dependent drift. For many problems, the prediction
task is exacerbated by small labeled datasets since obtaining ground-truth
labels requires expensive equipment. In this work, we present Hierarchical
State-Space Models (HiSS), a conceptually simple, new technique for continuous
sequential prediction. HiSS stacks structured state-space models on top of each
other to create a temporal hierarchy. Across six real-world sensor datasets,
from tactile-based state prediction to accelerometer-based inertial
measurement, HiSS outperforms state-of-the-art sequence models such as causal
Transformers, LSTMs, S4, and Mamba by at least 23% on MSE. Our experiments
further indicate that HiSS demonstrates efficient scaling to smaller datasets
and is compatible with existing data-filtering techniques. Code, datasets and
videos can be found on https://hiss-csp.github.io.