ChatPaper.aiChatPaper

漏洩の検出と分割の修正:映像データセットにおける漏洩防止のためのクラスタリング手法

Find the Leak, Fix the Split: Cluster-Based Method to Prevent Leakage in Video-Derived Datasets

November 17, 2025
著者: Noam Glazner, Noam Tsfaty, Sharon Shalev, Avishai Weizman
cs.AI

要旨

映像から抽出されたフレームデータセットにおける情報漏洩を軽減するため、クラスタベースのフレーム選択戦略を提案します。学習用・検証用・テスト用の各セットに分割する前に視覚的に類似したフレームをグループ化することで、より代表的で均衡の取れた信頼性の高いデータセット分割を実現します。
English
We propose a cluster-based frame selection strategy to mitigate information leakage in video-derived frames datasets. By grouping visually similar frames before splitting into training, validation, and test sets, the method produces more representative, balanced, and reliable dataset partitions.
PDF01December 2, 2025