ChatPaper.aiChatPaper

PATS : Échantillonnage Temporel Conscient de la Maîtrise pour l'Évaluation des Compétences Sportives Multi-Vues

PATS: Proficiency-Aware Temporal Sampling for Multi-View Sports Skill Assessment

June 5, 2025
Auteurs: Edoardo Bianchi, Antonio Liotta
cs.AI

Résumé

L'évaluation automatisée des compétences sportives nécessite la capture de modèles de mouvement fondamentaux qui distinguent les performances expertes de celles des novices. Cependant, les méthodes actuelles d'échantillonnage vidéo perturbent la continuité temporelle essentielle à l'évaluation de la maîtrise. À cette fin, nous introduisons l'**Échantillonnage Temporel Conscient de la Maîtrise (PATS)**, une nouvelle stratégie d'échantillonnage qui préserve les mouvements fondamentaux complets au sein de segments temporels continus pour une évaluation des compétences multi-vues. PATS segmente de manière adaptative les vidéos pour s'assurer que chaque portion analysée contient l'exécution complète des composantes critiques de la performance, répétant ce processus sur plusieurs segments pour maximiser la couverture d'informations tout en maintenant la cohérence temporelle. Évalué sur le benchmark EgoExo4D avec SkillFormer, PATS surpasse l'exactitude de l'état de l'art dans toutes les configurations de visualisation (+0,65 % à +3,05 %) et offre des gains substantiels dans des domaines difficiles (+26,22 % en escalade de bloc, +2,39 % en musique, +1,13 % en basketball). Une analyse systématique révèle que PATS s'adapte avec succès à diverses caractéristiques d'activité – de l'échantillonnage à haute fréquence pour les sports dynamiques à la segmentation fine pour les compétences séquentielles – démontrant son efficacité en tant qu'approche adaptative d'échantillonnage temporel qui fait progresser l'évaluation automatisée des compétences pour des applications réelles.
English
Automated sports skill assessment requires capturing fundamental movement patterns that distinguish expert from novice performance, yet current video sampling methods disrupt the temporal continuity essential for proficiency evaluation. To this end, we introduce Proficiency-Aware Temporal Sampling (PATS), a novel sampling strategy that preserves complete fundamental movements within continuous temporal segments for multi-view skill assessment. PATS adaptively segments videos to ensure each analyzed portion contains full execution of critical performance components, repeating this process across multiple segments to maximize information coverage while maintaining temporal coherence. Evaluated on the EgoExo4D benchmark with SkillFormer, PATS surpasses the state-of-the-art accuracy across all viewing configurations (+0.65% to +3.05%) and delivers substantial gains in challenging domains (+26.22% bouldering, +2.39% music, +1.13% basketball). Systematic analysis reveals that PATS successfully adapts to diverse activity characteristics-from high-frequency sampling for dynamic sports to fine-grained segmentation for sequential skills-demonstrating its effectiveness as an adaptive approach to temporal sampling that advances automated skill assessment for real-world applications.
PDF11June 6, 2025