ChatPaper.aiChatPaper

Lekkage Opsporen en Splitsing Herstellen: Op Clusters Gebaseerde Methode om Lekkage in Videogestuurde Datasets te Voorkomen

Find the Leak, Fix the Split: Cluster-Based Method to Prevent Leakage in Video-Derived Datasets

November 17, 2025
Auteurs: Noam Glazner, Noam Tsfaty, Sharon Shalev, Avishai Weizman
cs.AI

Samenvatting

Wij stellen een clustergebaseerde frameselectiestrategie voor om informatielekken in op video's gebaseerde framedatasets tegen te gaan. Door visueel gelijkaardige frames te groeperen voordat ze worden opgesplitst in trainings-, validatie- en testverzamelingen, produceert de methode representatievere, evenwichtigere en betrouwbaardere datasetpartities.
English
We propose a cluster-based frame selection strategy to mitigate information leakage in video-derived frames datasets. By grouping visually similar frames before splitting into training, validation, and test sets, the method produces more representative, balanced, and reliable dataset partitions.
PDF01December 2, 2025