ChatPaper.aiChatPaper

Mirada al Corazón: Un Conjunto de Datos de Vídeo Multivista para rPPG y Estimación de Biomarcadores de Salud

Gaze into the Heart: A Multi-View Video Dataset for rPPG and Health Biomarkers Estimation

August 25, 2025
Autores: Konstantin Egorov, Stepan Botman, Pavel Blinov, Galina Zubkova, Anton Ivaschenko, Alexander Kolsanov, Andrey Savchenko
cs.AI

Resumen

El progreso en la fotopletismografía remota (rPPG) se ve limitado por los problemas críticos de los conjuntos de datos públicos disponibles: tamaño reducido, preocupaciones de privacidad con los videos faciales y falta de diversidad en las condiciones. Este artículo presenta un nuevo conjunto de datos de video a gran escala y multi-vista para la estimación de rPPG y biomarcadores de salud. Nuestro conjunto de datos incluye 3600 grabaciones de video sincronizadas de 600 sujetos, capturadas en diversas condiciones (en reposo y post-ejercicio) utilizando múltiples cámaras de consumo en diferentes ángulos. Para permitir un análisis multimodal de los estados fisiológicos, cada grabación se acompaña de una señal PPG de 100 Hz y métricas de salud extendidas, como electrocardiograma, presión arterial, biomarcadores, temperatura, saturación de oxígeno, frecuencia respiratoria y nivel de estrés. Utilizando estos datos, entrenamos un modelo eficiente de rPPG y comparamos su calidad con enfoques existentes en escenarios de evaluación cruzada entre conjuntos de datos. La publicación pública de nuestro conjunto de datos y modelo debería acelerar significativamente el progreso en el desarrollo de asistentes médicos basados en IA.
English
Progress in remote PhotoPlethysmoGraphy (rPPG) is limited by the critical issues of existing publicly available datasets: small size, privacy concerns with facial videos, and lack of diversity in conditions. The paper introduces a novel comprehensive large-scale multi-view video dataset for rPPG and health biomarkers estimation. Our dataset comprises 3600 synchronized video recordings from 600 subjects, captured under varied conditions (resting and post-exercise) using multiple consumer-grade cameras at different angles. To enable multimodal analysis of physiological states, each recording is paired with a 100 Hz PPG signal and extended health metrics, such as electrocardiogram, arterial blood pressure, biomarkers, temperature, oxygen saturation, respiratory rate, and stress level. Using this data, we train an efficient rPPG model and compare its quality with existing approaches in cross-dataset scenarios. The public release of our dataset and model should significantly speed up the progress in the development of AI medical assistants.
PDF142August 28, 2025