ChatPaper.aiChatPaper

Encontre o Vazamento, Corrija a Divisão: Método Baseado em Clusters para Prevenir Vazamento em Conjuntos de Dados Derivados de Vídeo

Find the Leak, Fix the Split: Cluster-Based Method to Prevent Leakage in Video-Derived Datasets

November 17, 2025
Autores: Noam Glazner, Noam Tsfaty, Sharon Shalev, Avishai Weizman
cs.AI

Resumo

Propomos uma estratégia de seleção de *frames* baseada em agrupamento para mitigar o vazamento de informação em conjuntos de dados derivados de vídeos. Ao agrupar *frames* visualmente similares antes da divisão em conjuntos de treinamento, validação e teste, o método produz partições de dados mais representativas, balanceadas e confiáveis.
English
We propose a cluster-based frame selection strategy to mitigate information leakage in video-derived frames datasets. By grouping visually similar frames before splitting into training, validation, and test sets, the method produces more representative, balanced, and reliable dataset partitions.
PDF12March 7, 2026