Verbeteren van Objectdetectie met Bevoorrechte Informatie: Een Model-agnostische Leraar-Leerling Benadering

Samenvatting

Dit artikel onderzoekt de integratie van het Learning Using Privileged Information (LUPI)-paradigma in objectdetectie om gebruik te maken van fijnmazige, beschrijvende informatie die tijdens de training beschikbaar is, maar niet tijdens de inferentie. We introduceren een algemene, model-agnostische methodologie voor het injecteren van geprivilegieerde informatie—zoals bounding box-maskers, saliency maps en dieptesignalen—in op deep learning gebaseerde objectdetectoren via een teacher-studentarchitectuur. Er worden experimenten uitgevoerd met vijf state-of-the-art objectdetectiemodellen en meerdere publieke benchmarks, waaronder op UAV gebaseerde datasets voor zwerfafvaldetectie en Pascal VOC 2012, om de impact op nauwkeurigheid, generalisatie en computationele efficiëntie te beoordelen. Onze resultaten tonen aan dat met LUPI getrainde studentmodellen consistent superieur presteren aan hun baseline-tegenhangers, met significante verbeteringen in detectienauwkeurigheid zonder toename van inferentiecomplexiteit of modelgrootte. Prestatieverbeteringen zijn vooral merkbaar voor middelgrote en grote objecten, terwijl ablatiestudies aantonen dat een intermediaire weging van de teacher-ondersteuning een optimale balans biedt tussen leren van geprivilegieerde en standaard invoer. De bevindingen bevestigen dat het LUPI-raamwerk een effectieve en praktische strategie biedt voor het verbeteren van objectdetectiesystemen in zowel resource-beperkte als real-world omgevingen.

English

This paper investigates the integration of the Learning Using Privileged Information (LUPI) paradigm in object detection to exploit fine-grained, descriptive information available during training but not at inference. We introduce a general, model-agnostic methodology for injecting privileged information-such as bounding box masks, saliency maps, and depth cues-into deep learning-based object detectors through a teacher-student architecture. Experiments are conducted across five state-of-the-art object detection models and multiple public benchmarks, including UAV-based litter detection datasets and Pascal VOC 2012, to assess the impact on accuracy, generalization, and computational efficiency. Our results demonstrate that LUPI-trained students consistently outperform their baseline counterparts, achieving significant boosts in detection accuracy with no increase in inference complexity or model size. Performance improvements are especially marked for medium and large objects, while ablation studies reveal that intermediate weighting of teacher guidance optimally balances learning from privileged and standard inputs. The findings affirm that the LUPI framework provides an effective and practical strategy for advancing object detection systems in both resource-constrained and real-world settings.

Verbeteren van Objectdetectie met Bevoorrechte Informatie: Een Model-agnostische Leraar-Leerling Benadering

Enhancing Object Detection with Privileged Information: A Model-Agnostic Teacher-Student Approach

Samenvatting

Support