Aprimorando a Detecção de Objetos com Informação Privilegiada: Uma Abordagem Modelo-Agnóstica de Aprendizagem Mestre-Discípulo
Enhancing Object Detection with Privileged Information: A Model-Agnostic Teacher-Student Approach
January 5, 2026
Autores: Matthias Bartolo, Dylan Seychell, Gabriel Hili, Matthew Montebello, Carl James Debono, Saviour Formosa, Konstantinos Makantasis
cs.AI
Resumo
Este artigo investiga a integração do paradigma de Aprendizado Usando Informação Privilegiada (LUPI) na detecção de objetos para explorar informações descritivas de alto nível disponíveis durante o treinamento, mas não durante a inferência. Introduzimos uma metodologia geral e independente de modelo para injetar informação privilegiada - como máscaras de bounding box, mapas de saliência e pistas de profundidade - em detectores de objetos baseados em aprendizado profundo por meio de uma arquitetura professor-aluno. Experimentos são conduzidos com cinco modelos de detecção de objetos de última geração e múltiplos benchmarks públicos, incluindo conjuntos de dados de detecção de lixo baseados em UAV e o Pascal VOC 2012, para avaliar o impacto na precisão, generalização e eficiência computacional. Nossos resultados demonstram que os modelos alunos treinados com LUPI superam consistentemente suas contrapartes baselines, alcançando aumentos significativos na precisão de detecção sem aumento na complexidade de inferência ou no tamanho do modelo. As melhorias de desempenho são especialmente marcantes para objetos de tamanho médio e grande, enquanto estudos de ablação revelam que a ponderação intermediária da orientação do professor equilibra de forma ideal o aprendizado a partir de entradas privilegiadas e padrão. Os resultados confirmam que a estrutura LUPI fornece uma estratégia eficaz e prática para avançar os sistemas de detecção de objetos tanto em ambientes com restrição de recursos quanto em cenários do mundo real.
English
This paper investigates the integration of the Learning Using Privileged Information (LUPI) paradigm in object detection to exploit fine-grained, descriptive information available during training but not at inference. We introduce a general, model-agnostic methodology for injecting privileged information-such as bounding box masks, saliency maps, and depth cues-into deep learning-based object detectors through a teacher-student architecture. Experiments are conducted across five state-of-the-art object detection models and multiple public benchmarks, including UAV-based litter detection datasets and Pascal VOC 2012, to assess the impact on accuracy, generalization, and computational efficiency. Our results demonstrate that LUPI-trained students consistently outperform their baseline counterparts, achieving significant boosts in detection accuracy with no increase in inference complexity or model size. Performance improvements are especially marked for medium and large objects, while ablation studies reveal that intermediate weighting of teacher guidance optimally balances learning from privileged and standard inputs. The findings affirm that the LUPI framework provides an effective and practical strategy for advancing object detection systems in both resource-constrained and real-world settings.