ChatPaper.aiChatPaper

Detectar la Fuga, Corregir la División: Método Basado en Clustering para Prevenir Filtraciones en Conjuntos de Datos Derivados de Vídeo

Find the Leak, Fix the Split: Cluster-Based Method to Prevent Leakage in Video-Derived Datasets

November 17, 2025
Autores: Noam Glazner, Noam Tsfaty, Sharon Shalev, Avishai Weizman
cs.AI

Resumen

Proponemos una estrategia de selección de fotogramas basada en agrupamiento para mitigar la filtración de información en conjuntos de datos derivados de vídeo. Al agrupar fotogramas visualmente similares antes de dividirlos en conjuntos de entrenamiento, validación y prueba, el método genera particiones de datos más representativas, equilibradas y fiables.
English
We propose a cluster-based frame selection strategy to mitigate information leakage in video-derived frames datasets. By grouping visually similar frames before splitting into training, validation, and test sets, the method produces more representative, balanced, and reliable dataset partitions.
PDF01December 2, 2025