Mejora de la Detección de Objetos con Información Privilegiada: Un Enfoque Maestro-Estudiante Agnóstico al Modelo
Enhancing Object Detection with Privileged Information: A Model-Agnostic Teacher-Student Approach
January 5, 2026
Autores: Matthias Bartolo, Dylan Seychell, Gabriel Hili, Matthew Montebello, Carl James Debono, Saviour Formosa, Konstantinos Makantasis
cs.AI
Resumen
Este artículo investiga la integración del paradigma de Aprendizaje Utilizando Información Privilegiada (LUPI) en la detección de objetos para aprovechar información detallada y descriptiva disponible durante el entrenamiento pero no durante la inferencia. Introducimos una metodología general e independiente del modelo para inyectar información privilegiada—como máscaras de cuadros delimitadores, mapas de saliencia y claves de profundidad—en detectores de objetos basados en aprendizaje profundo mediante una arquitectura maestro-estudiante. Se realizan experimentos en cinco modelos de vanguardia de detección de objetos y múltiples benchmarks públicos, incluyendo conjuntos de datos de detección de basura basados en UAV y Pascal VOC 2012, para evaluar el impacto en la precisión, generalización y eficiencia computacional. Nuestros resultados demuestran que los modelos estudiante entrenados con LUPI superan consistentemente a sus contrapartes de referencia, logrando mejoras significativas en la precisión de detección sin aumentar la complejidad de inferencia ni el tamaño del modelo. Las mejoras de rendimiento son especialmente notables para objetos medianos y grandes, mientras que estudios de ablación revelan que una ponderación intermedia de la guía del maestro equilibra óptimamente el aprendizaje a partir de entradas privilegiadas y estándar. Los hallazgos confirman que el marco LUPI proporciona una estrategia efectiva y práctica para avanzar en los sistemas de detección de objetos, tanto en entornos con recursos limitados como en escenarios del mundo real.
English
This paper investigates the integration of the Learning Using Privileged Information (LUPI) paradigm in object detection to exploit fine-grained, descriptive information available during training but not at inference. We introduce a general, model-agnostic methodology for injecting privileged information-such as bounding box masks, saliency maps, and depth cues-into deep learning-based object detectors through a teacher-student architecture. Experiments are conducted across five state-of-the-art object detection models and multiple public benchmarks, including UAV-based litter detection datasets and Pascal VOC 2012, to assess the impact on accuracy, generalization, and computational efficiency. Our results demonstrate that LUPI-trained students consistently outperform their baseline counterparts, achieving significant boosts in detection accuracy with no increase in inference complexity or model size. Performance improvements are especially marked for medium and large objects, while ablation studies reveal that intermediate weighting of teacher guidance optimally balances learning from privileged and standard inputs. The findings affirm that the LUPI framework provides an effective and practical strategy for advancing object detection systems in both resource-constrained and real-world settings.