ChatPaper.aiChatPaper

Улучшение обнаружения объектов с использованием привилегированной информации: модель-независимый подход «учитель-ученик»

Enhancing Object Detection with Privileged Information: A Model-Agnostic Teacher-Student Approach

January 5, 2026
Авторы: Matthias Bartolo, Dylan Seychell, Gabriel Hili, Matthew Montebello, Carl James Debono, Saviour Formosa, Konstantinos Makantasis
cs.AI

Аннотация

В данной работе исследуется интеграция парадигмы обучения с использованием привилегированной информации (LUPI) в задачу обнаружения объектов с целью использования детальной, описательной информации, доступной на этапе обучения, но отсутствующей на этапе вывода. Мы предлагаем общую, модельно-независимую методологию для внедрения привилегированной информации, такой как маски ограничивающих рамок, карты значимости и данные о глубине, в глубокие нейросетевые детекторы объектов с помощью архитектуры "учитель-ученик". Эксперименты проводятся на пяти современных моделях обнаружения объектов и нескольких публичных наборах данных, включая наборы для обнаружения мусора с БПЛА и Pascal VOC 2012, для оценки влияния на точность, способность к обобщению и вычислительную эффективность. Наши результаты показывают, что модели-ученики, обученные по методологии LUPI, последовательно превосходят базовые версии, демонстрируя значительный прирост точности обнаружения без увеличения сложности вывода или размера модели. Улучшения производительности особенно выражены для средних и крупных объектов, а ablation-исследования показывают, что промежуточное взвешивание руководства учителя оптимально балансирует обучение на основе привилегированной и стандартной входной информации. Полученные результаты подтверждают, что framework LUPI предоставляет эффективную и практичную стратегию для совершенствования систем обнаружения объектов как в условиях ограниченных ресурсов, так и в реальных сценариях.
English
This paper investigates the integration of the Learning Using Privileged Information (LUPI) paradigm in object detection to exploit fine-grained, descriptive information available during training but not at inference. We introduce a general, model-agnostic methodology for injecting privileged information-such as bounding box masks, saliency maps, and depth cues-into deep learning-based object detectors through a teacher-student architecture. Experiments are conducted across five state-of-the-art object detection models and multiple public benchmarks, including UAV-based litter detection datasets and Pascal VOC 2012, to assess the impact on accuracy, generalization, and computational efficiency. Our results demonstrate that LUPI-trained students consistently outperform their baseline counterparts, achieving significant boosts in detection accuracy with no increase in inference complexity or model size. Performance improvements are especially marked for medium and large objects, while ablation studies reveal that intermediate weighting of teacher guidance optimally balances learning from privileged and standard inputs. The findings affirm that the LUPI framework provides an effective and practical strategy for advancing object detection systems in both resource-constrained and real-world settings.
PDF11January 10, 2026