ChatPaper.aiChatPaper

Détecter la Fuite, Réparer la Faille : Méthode par Clustering pour Prévenir les Fuites dans les Jeux de Données Vidéo

Find the Leak, Fix the Split: Cluster-Based Method to Prevent Leakage in Video-Derived Datasets

November 17, 2025
papers.authors: Noam Glazner, Noam Tsfaty, Sharon Shalev, Avishai Weizman
cs.AI

papers.abstract

Nous proposons une stratégie de sélection d'images basée sur le regroupement en clusters pour atténuer la fuite d'information dans les jeux de données d'images dérivées de vidéos. En regroupant les images visuellement similaires avant leur division en ensembles d'entraînement, de validation et de test, cette méthode produit des partitions de jeux de données plus représentatives, équilibrées et fiables.
English
We propose a cluster-based frame selection strategy to mitigate information leakage in video-derived frames datasets. By grouping visually similar frames before splitting into training, validation, and test sets, the method produces more representative, balanced, and reliable dataset partitions.
PDF01December 2, 2025