ChatPaper.aiChatPaper

Verbesserung der Objekterkennung mit privilegierten Informationen: Ein modellagnostischer Teacher-Student-Ansatz

Enhancing Object Detection with Privileged Information: A Model-Agnostic Teacher-Student Approach

January 5, 2026
papers.authors: Matthias Bartolo, Dylan Seychell, Gabriel Hili, Matthew Montebello, Carl James Debono, Saviour Formosa, Konstantinos Makantasis
cs.AI

papers.abstract

Diese Arbeit untersucht die Integration des Paradigmas "Learning Using Privileged Information" (LUPI) in die Objekterkennung, um feingranulare, beschreibende Informationen zu nutzen, die während des Trainings, jedoch nicht während des Inferenzzeitpunkts verfügbar sind. Wir stellen eine allgemeine, modellagnostische Methodik vor, um privilegierte Informationen – wie Bounding-Box-Masken, Saliency Maps und Tiefeninformationen – über eine Teacher-Student-Architektur in tiefenlernbasierte Objektdetektoren zu injizieren. Experimente werden mit fünf state-of-the-art Objekterkennungsmodellen und mehreren öffentlichen Benchmarks, einschließlich UAV-basierter Litter-Detektion-Datensätzen und Pascal VOC 2012, durchgeführt, um die Auswirkungen auf Genauigkeit, Generalisierungsfähigkeit und Recheneffizienz zu bewerten. Unsere Ergebnisse zeigen, dass nach dem LUPI-Paradigma trainierte Studentenmodelle ihre Baseline-Pendants konsistent übertreffen und signifikante Steigerungen der Detektionsgenauigkeit ohne Erhöhung der Inferenzkomplexität oder Modellgröße erzielen. Die Leistungsverbesserungen sind besonders ausgeprägt für mittlere und große Objekte, während Ablationsstudien zeigen, dass eine intermediate Gewichtung der Teacher-Anleitung das Lernen aus privilegierten und standardmäßigen Eingaben optimal ausbalanciert. Die Ergebnisse bestätigen, dass der LUPI-Rahmen eine effektive und praktische Strategie zur Weiterentwicklung von Objekterkennungssystemen sowohl in ressourcenbeschränkten als auch in realen Anwendungsszenarien bietet.
English
This paper investigates the integration of the Learning Using Privileged Information (LUPI) paradigm in object detection to exploit fine-grained, descriptive information available during training but not at inference. We introduce a general, model-agnostic methodology for injecting privileged information-such as bounding box masks, saliency maps, and depth cues-into deep learning-based object detectors through a teacher-student architecture. Experiments are conducted across five state-of-the-art object detection models and multiple public benchmarks, including UAV-based litter detection datasets and Pascal VOC 2012, to assess the impact on accuracy, generalization, and computational efficiency. Our results demonstrate that LUPI-trained students consistently outperform their baseline counterparts, achieving significant boosts in detection accuracy with no increase in inference complexity or model size. Performance improvements are especially marked for medium and large objects, while ablation studies reveal that intermediate weighting of teacher guidance optimally balances learning from privileged and standard inputs. The findings affirm that the LUPI framework provides an effective and practical strategy for advancing object detection systems in both resource-constrained and real-world settings.
PDF11January 10, 2026