Modelos Hierárquicos de Espaço de Estados para Modelagem Contínua de Sequência para Sequência
Hierarchical State Space Models for Continuous Sequence-to-Sequence Modeling
February 15, 2024
Autores: Raunaq Bhirangi, Chenyu Wang, Venkatesh Pattabiraman, Carmel Majidi, Abhinav Gupta, Tess Hellebrekers, Lerrel Pinto
cs.AI
Resumo
Raciocinar a partir de sequências de dados sensoriais brutos é um problema ubíquo em áreas que vão desde dispositivos médicos até robótica. Esses problemas frequentemente envolvem o uso de longas sequências de dados brutos de sensores (por exemplo, magnetômetros, piezoresistores) para prever sequências de quantidades físicas desejáveis (por exemplo, força, medições inerciais). Embora as abordagens clássicas sejam poderosas para problemas de previsão localmente lineares, elas frequentemente falham ao usar sensores do mundo real. Esses sensores são tipicamente não lineares, são afetados por variáveis externas (por exemplo, vibração) e exibem deriva dependente dos dados. Para muitos problemas, a tarefa de previsão é agravada por conjuntos de dados rotulados pequenos, já que a obtenção de rótulos de verdade fundamental requer equipamentos caros. Neste trabalho, apresentamos os Modelos Hierárquicos de Espaço de Estados (HiSS), uma técnica nova e conceitualmente simples para previsão sequencial contínua. O HiSS empilha modelos estruturados de espaço de estados uns sobre os outros para criar uma hierarquia temporal. Em seis conjuntos de dados reais de sensores, desde a previsão de estado baseada em tato até medições inerciais baseadas em acelerômetros, o HiSS supera modelos de sequência de última geração, como Transformers causais, LSTMs, S4 e Mamba, em pelo menos 23% no erro quadrático médio (MSE). Nossos experimentos ainda indicam que o HiSS demonstra escalabilidade eficiente para conjuntos de dados menores e é compatível com técnicas existentes de filtragem de dados. Código, conjuntos de dados e vídeos podem ser encontrados em https://hiss-csp.github.io.
English
Reasoning from sequences of raw sensory data is a ubiquitous problem across
fields ranging from medical devices to robotics. These problems often involve
using long sequences of raw sensor data (e.g. magnetometers, piezoresistors) to
predict sequences of desirable physical quantities (e.g. force, inertial
measurements). While classical approaches are powerful for locally-linear
prediction problems, they often fall short when using real-world sensors. These
sensors are typically non-linear, are affected by extraneous variables (e.g.
vibration), and exhibit data-dependent drift. For many problems, the prediction
task is exacerbated by small labeled datasets since obtaining ground-truth
labels requires expensive equipment. In this work, we present Hierarchical
State-Space Models (HiSS), a conceptually simple, new technique for continuous
sequential prediction. HiSS stacks structured state-space models on top of each
other to create a temporal hierarchy. Across six real-world sensor datasets,
from tactile-based state prediction to accelerometer-based inertial
measurement, HiSS outperforms state-of-the-art sequence models such as causal
Transformers, LSTMs, S4, and Mamba by at least 23% on MSE. Our experiments
further indicate that HiSS demonstrates efficient scaling to smaller datasets
and is compatible with existing data-filtering techniques. Code, datasets and
videos can be found on https://hiss-csp.github.io.