ChatPaper.aiChatPaper

Individuare la Fuga, Riparare la Fuga: Metodo Basato su Cluster per Prevenire la Fuga di Informazioni nei Dataset Derivati da Video

Find the Leak, Fix the Split: Cluster-Based Method to Prevent Leakage in Video-Derived Datasets

November 17, 2025
Autori: Noam Glazner, Noam Tsfaty, Sharon Shalev, Avishai Weizman
cs.AI

Abstract

Proponiamo una strategia di selezione dei frame basata sul clustering per mitigare la perdita di informazioni nei dataset derivati da video. Raggruppando i frame visivamente simili prima della suddivisione in set di addestramento, validazione e test, il metodo produce partizioni del dataset più rappresentative, bilanciate e affidabili.
English
We propose a cluster-based frame selection strategy to mitigate information leakage in video-derived frames datasets. By grouping visually similar frames before splitting into training, validation, and test sets, the method produces more representative, balanced, and reliable dataset partitions.
PDF01December 2, 2025