Regard au cœur : Un ensemble de données vidéo multi-vues pour l'estimation de la rPPG et des biomarqueurs de santé
Gaze into the Heart: A Multi-View Video Dataset for rPPG and Health Biomarkers Estimation
August 25, 2025
papers.authors: Konstantin Egorov, Stepan Botman, Pavel Blinov, Galina Zubkova, Anton Ivaschenko, Alexander Kolsanov, Andrey Savchenko
cs.AI
papers.abstract
Les progrès en photopléthysmographie à distance (rPPG) sont limités par les problèmes critiques des ensembles de données publiques existants : taille réduite, préoccupations liées à la confidentialité des vidéos faciales et manque de diversité dans les conditions d'acquisition. Cet article présente un nouvel ensemble de données vidéo multi-vues complet et à grande échelle pour la rPPG et l'estimation des biomarqueurs de santé. Notre ensemble de données comprend 3600 enregistrements vidéo synchronisés provenant de 600 sujets, capturés dans des conditions variées (repos et post-exercice) à l'aide de plusieurs caméras grand public sous différents angles. Pour permettre une analyse multimodale des états physiologiques, chaque enregistrement est associé à un signal PPG à 100 Hz et à des mesures de santé étendues, telles que l'électrocardiogramme, la pression artérielle, les biomarqueurs, la température, la saturation en oxygène, la fréquence respiratoire et le niveau de stress. En utilisant ces données, nous entraînons un modèle rPPG efficace et comparons sa qualité avec les approches existantes dans des scénarios inter-datasets. La publication publique de notre ensemble de données et de notre modèle devrait accélérer significativement les progrès dans le développement d'assistants médicaux basés sur l'IA.
English
Progress in remote PhotoPlethysmoGraphy (rPPG) is limited by the critical
issues of existing publicly available datasets: small size, privacy concerns
with facial videos, and lack of diversity in conditions. The paper introduces a
novel comprehensive large-scale multi-view video dataset for rPPG and health
biomarkers estimation. Our dataset comprises 3600 synchronized video recordings
from 600 subjects, captured under varied conditions (resting and post-exercise)
using multiple consumer-grade cameras at different angles. To enable multimodal
analysis of physiological states, each recording is paired with a 100 Hz PPG
signal and extended health metrics, such as electrocardiogram, arterial blood
pressure, biomarkers, temperature, oxygen saturation, respiratory rate, and
stress level. Using this data, we train an efficient rPPG model and compare its
quality with existing approaches in cross-dataset scenarios. The public release
of our dataset and model should significantly speed up the progress in the
development of AI medical assistants.