ChatPaper.aiChatPaper

特権情報を用いた物体検出の強化:モデルに依存しないTeacher-Studentアプローチ

Enhancing Object Detection with Privileged Information: A Model-Agnostic Teacher-Student Approach

January 5, 2026
著者: Matthias Bartolo, Dylan Seychell, Gabriel Hili, Matthew Montebello, Carl James Debono, Saviour Formosa, Konstantinos Makantasis
cs.AI

要旨

本論文では、学習時には利用可能であるが推論時には利用できない詳細な記述情報を活用するため、オブジェクト検出への「特権情報を用いた学習(LUPI)」パラダイムの統合を検討する。境界ボックスマスク、顕著性マップ、深度情報などの特権情報を、教師-生徒アーキテクチャを介して深層学習ベースのオブジェクト検出器に注入する、モデルに依存しない一般的な手法を提案する。精度、汎化性能、計算効率への影響を評価するため、5つの最先端オブジェクト検出モデルと、UAVベースのごみ検出データセットやPascal VOC 2012を含む複数の公開ベンチマークで実験を実施した。結果は、LUPIで学習した生徒モデルが一貫してベースラインを上回り、推論の複雑さやモデルサイズを増加させることなく検出精度を大幅に向上させることを示している。特に中規模および大規模オブジェクトでの性能向上が顕著であり、 ablation study により、教師の指導を中間的に重み付けることが特権情報と標準入力からの学習を最適にバランスさせることを明らかにした。本知見は、LUPIフレームワークが、リソース制約のある環境および実世界の環境の両方において、オブジェクト検出システムを高度化するための効果的かつ実用的な戦略を提供することを裏付けている。
English
This paper investigates the integration of the Learning Using Privileged Information (LUPI) paradigm in object detection to exploit fine-grained, descriptive information available during training but not at inference. We introduce a general, model-agnostic methodology for injecting privileged information-such as bounding box masks, saliency maps, and depth cues-into deep learning-based object detectors through a teacher-student architecture. Experiments are conducted across five state-of-the-art object detection models and multiple public benchmarks, including UAV-based litter detection datasets and Pascal VOC 2012, to assess the impact on accuracy, generalization, and computational efficiency. Our results demonstrate that LUPI-trained students consistently outperform their baseline counterparts, achieving significant boosts in detection accuracy with no increase in inference complexity or model size. Performance improvements are especially marked for medium and large objects, while ablation studies reveal that intermediate weighting of teacher guidance optimally balances learning from privileged and standard inputs. The findings affirm that the LUPI framework provides an effective and practical strategy for advancing object detection systems in both resource-constrained and real-world settings.
PDF11January 10, 2026