PATS : Échantillonnage Temporel Conscient de la Maîtrise pour l'Évaluation des Compétences Sportives Multi-Vues
PATS: Proficiency-Aware Temporal Sampling for Multi-View Sports Skill Assessment
June 5, 2025
Auteurs: Edoardo Bianchi, Antonio Liotta
cs.AI
Résumé
L'évaluation automatisée des compétences sportives nécessite la capture de modèles de mouvement fondamentaux qui distinguent les performances expertes de celles des novices. Cependant, les méthodes actuelles d'échantillonnage vidéo perturbent la continuité temporelle essentielle à l'évaluation de la maîtrise. À cette fin, nous introduisons l'**Échantillonnage Temporel Conscient de la Maîtrise (PATS)**, une nouvelle stratégie d'échantillonnage qui préserve les mouvements fondamentaux complets au sein de segments temporels continus pour une évaluation des compétences multi-vues. PATS segmente de manière adaptative les vidéos pour s'assurer que chaque portion analysée contient l'exécution complète des composantes critiques de la performance, répétant ce processus sur plusieurs segments pour maximiser la couverture d'informations tout en maintenant la cohérence temporelle. Évalué sur le benchmark EgoExo4D avec SkillFormer, PATS surpasse l'exactitude de l'état de l'art dans toutes les configurations de visualisation (+0,65 % à +3,05 %) et offre des gains substantiels dans des domaines difficiles (+26,22 % en escalade de bloc, +2,39 % en musique, +1,13 % en basketball). Une analyse systématique révèle que PATS s'adapte avec succès à diverses caractéristiques d'activité – de l'échantillonnage à haute fréquence pour les sports dynamiques à la segmentation fine pour les compétences séquentielles – démontrant son efficacité en tant qu'approche adaptative d'échantillonnage temporel qui fait progresser l'évaluation automatisée des compétences pour des applications réelles.
English
Automated sports skill assessment requires capturing fundamental movement
patterns that distinguish expert from novice performance, yet current video
sampling methods disrupt the temporal continuity essential for proficiency
evaluation. To this end, we introduce Proficiency-Aware Temporal Sampling
(PATS), a novel sampling strategy that preserves complete fundamental movements
within continuous temporal segments for multi-view skill assessment. PATS
adaptively segments videos to ensure each analyzed portion contains full
execution of critical performance components, repeating this process across
multiple segments to maximize information coverage while maintaining temporal
coherence. Evaluated on the EgoExo4D benchmark with SkillFormer, PATS surpasses
the state-of-the-art accuracy across all viewing configurations (+0.65% to
+3.05%) and delivers substantial gains in challenging domains (+26.22%
bouldering, +2.39% music, +1.13% basketball). Systematic analysis reveals that
PATS successfully adapts to diverse activity characteristics-from
high-frequency sampling for dynamic sports to fine-grained segmentation for
sequential skills-demonstrating its effectiveness as an adaptive approach to
temporal sampling that advances automated skill assessment for real-world
applications.