특권 정보를 활용한 객체 검출 성능 향상: 모델 중립적 교사-학생 접근법
Enhancing Object Detection with Privileged Information: A Model-Agnostic Teacher-Student Approach
January 5, 2026
저자: Matthias Bartolo, Dylan Seychell, Gabriel Hili, Matthew Montebello, Carl James Debono, Saviour Formosa, Konstantinos Makantasis
cs.AI
초록
본 논문은 학습 시에는 이용 가능하지만 추론 시에는 이용할 수 없는 세밀한 설명 정보를 활용하기 위해, 객체 인식에 특권 정보 학습(LUPI) 패러다임을 통합하는 방안을 연구한다. 우리는 바운딩 박스 마스크, salient 맵, 깊이 정보와 같은 특권 정보를 교사-학생 구조를 통해 딥러닝 기반 객체 인식기에 주입하는 일반적이고 모델에 독립적인 방법론을 제안한다. 정확도, 일반화 성능, 계산 효율성에 미치는 영향을 평가하기 위해 5개의 최신 객체 인식 모델과 UAV 기반 쓰레기 탐지 데이터셋 및 Pascal VOC 2012를 포함한 여러 공개 벤치마크에서 실험을 수행했다. 우리의 결과는 LUPI로 학습된 학생 모델이 추론 복잡도나 모델 크기의 증가 없이 탐지 정확도에서 상당한 향상을 달성하며, 기준 모델을 지속적으로 능가함을 보여준다. 성능 향상은 중간 및 대형 객체에서 특히 두드러지며, 애블레이션 연구는 교사 지도를 중간 가중치로 적용할 때 특권 정보와 표준 입력으로부터의 학습이 최적으로 균형을 이룸을 보여준다. 이러한 결과는 LUPI 프레임워크가 자원이 제한된 환경과 실제 환경 모두에서 객체 인식 시스템을 발전시키는 효과적이고 실용적인 전략을 제공함을 확인해 준다.
English
This paper investigates the integration of the Learning Using Privileged Information (LUPI) paradigm in object detection to exploit fine-grained, descriptive information available during training but not at inference. We introduce a general, model-agnostic methodology for injecting privileged information-such as bounding box masks, saliency maps, and depth cues-into deep learning-based object detectors through a teacher-student architecture. Experiments are conducted across five state-of-the-art object detection models and multiple public benchmarks, including UAV-based litter detection datasets and Pascal VOC 2012, to assess the impact on accuracy, generalization, and computational efficiency. Our results demonstrate that LUPI-trained students consistently outperform their baseline counterparts, achieving significant boosts in detection accuracy with no increase in inference complexity or model size. Performance improvements are especially marked for medium and large objects, while ablation studies reveal that intermediate weighting of teacher guidance optimally balances learning from privileged and standard inputs. The findings affirm that the LUPI framework provides an effective and practical strategy for advancing object detection systems in both resource-constrained and real-world settings.