ChatPaper.aiChatPaper

Modelos Hierárquicos de Espaço de Estados para Modelagem Contínua de Sequência para Sequência

Hierarchical State Space Models for Continuous Sequence-to-Sequence Modeling

February 15, 2024
Autores: Raunaq Bhirangi, Chenyu Wang, Venkatesh Pattabiraman, Carmel Majidi, Abhinav Gupta, Tess Hellebrekers, Lerrel Pinto
cs.AI

Resumo

Raciocinar a partir de sequências de dados sensoriais brutos é um problema ubíquo em áreas que vão desde dispositivos médicos até robótica. Esses problemas frequentemente envolvem o uso de longas sequências de dados brutos de sensores (por exemplo, magnetômetros, piezoresistores) para prever sequências de quantidades físicas desejáveis (por exemplo, força, medições inerciais). Embora as abordagens clássicas sejam poderosas para problemas de previsão localmente lineares, elas frequentemente falham ao usar sensores do mundo real. Esses sensores são tipicamente não lineares, são afetados por variáveis externas (por exemplo, vibração) e exibem deriva dependente dos dados. Para muitos problemas, a tarefa de previsão é agravada por conjuntos de dados rotulados pequenos, já que a obtenção de rótulos de verdade fundamental requer equipamentos caros. Neste trabalho, apresentamos os Modelos Hierárquicos de Espaço de Estados (HiSS), uma técnica nova e conceitualmente simples para previsão sequencial contínua. O HiSS empilha modelos estruturados de espaço de estados uns sobre os outros para criar uma hierarquia temporal. Em seis conjuntos de dados reais de sensores, desde a previsão de estado baseada em tato até medições inerciais baseadas em acelerômetros, o HiSS supera modelos de sequência de última geração, como Transformers causais, LSTMs, S4 e Mamba, em pelo menos 23% no erro quadrático médio (MSE). Nossos experimentos ainda indicam que o HiSS demonstra escalabilidade eficiente para conjuntos de dados menores e é compatível com técnicas existentes de filtragem de dados. Código, conjuntos de dados e vídeos podem ser encontrados em https://hiss-csp.github.io.
English
Reasoning from sequences of raw sensory data is a ubiquitous problem across fields ranging from medical devices to robotics. These problems often involve using long sequences of raw sensor data (e.g. magnetometers, piezoresistors) to predict sequences of desirable physical quantities (e.g. force, inertial measurements). While classical approaches are powerful for locally-linear prediction problems, they often fall short when using real-world sensors. These sensors are typically non-linear, are affected by extraneous variables (e.g. vibration), and exhibit data-dependent drift. For many problems, the prediction task is exacerbated by small labeled datasets since obtaining ground-truth labels requires expensive equipment. In this work, we present Hierarchical State-Space Models (HiSS), a conceptually simple, new technique for continuous sequential prediction. HiSS stacks structured state-space models on top of each other to create a temporal hierarchy. Across six real-world sensor datasets, from tactile-based state prediction to accelerometer-based inertial measurement, HiSS outperforms state-of-the-art sequence models such as causal Transformers, LSTMs, S4, and Mamba by at least 23% on MSE. Our experiments further indicate that HiSS demonstrates efficient scaling to smaller datasets and is compatible with existing data-filtering techniques. Code, datasets and videos can be found on https://hiss-csp.github.io.
PDF141December 15, 2024