강력한 베이스라인: YOLOv12와 BoT-SORT-ReID를 활용한 다중 UAV 추적
Strong Baseline: Multi-UAV Tracking via YOLOv12 with BoT-SORT-ReID
March 21, 2025
저자: Yu-Hsi Chen
cs.AI
초록
열적외선 비디오에서 다중 무인항공기(UAV)를 탐지하고 추적하는 것은 낮은 대비, 환경 노이즈, 그리고 작은 표적 크기로 인해 본질적으로 어려운 과제입니다. 본 논문은 최근의 탐지 및 추적 기술 발전을 활용하여 열적외선 비디오에서 다중 UAV 추적을 해결하기 위한 직관적인 접근 방식을 제시합니다. YOLOv5와 DeepSORT 파이프라인에 의존하는 대신, YOLOv12와 BoT-SORT를 기반으로 구축된 추적 프레임워크를 제안하며, 이를 맞춤형 학습 및 추론 전략으로 강화하였습니다. 우리의 접근 방식은 4차 Anti-UAV Challenge의 지표를 따라 평가되었으며, 경쟁력 있는 성능을 입증하였습니다. 특히, UAV 특징을 강화하기 위해 대비 향상이나 시간적 정보 융합을 사용하지 않고도 강력한 결과를 달성함으로써, 다중 UAV 추적 작업을 위한 "강력한 기준선(Strong Baseline)"으로서의 가능성을 보여주었습니다. 구현 세부 사항, 심층적인 실험 분석, 그리고 잠재적인 개선 사항에 대한 논의를 제공합니다. 코드는 https://github.com/wish44165/YOLOv12-BoT-SORT-ReID에서 확인할 수 있습니다.
English
Detecting and tracking multiple unmanned aerial vehicles (UAVs) in thermal
infrared video is inherently challenging due to low contrast, environmental
noise, and small target sizes. This paper provides a straightforward approach
to address multi-UAV tracking in thermal infrared video, leveraging recent
advances in detection and tracking. Instead of relying on the YOLOv5 with the
DeepSORT pipeline, we present a tracking framework built on YOLOv12 and
BoT-SORT, enhanced with tailored training and inference strategies. We evaluate
our approach following the metrics from the 4th Anti-UAV Challenge and
demonstrate competitive performance. Notably, we achieve strong results without
using contrast enhancement or temporal information fusion to enrich UAV
features, highlighting our approach as a "Strong Baseline" for the multi-UAV
tracking task. We provide implementation details, in-depth experimental
analysis, and a discussion of potential improvements. The code is available at
https://github.com/wish44165/YOLOv12-BoT-SORT-ReID .Summary
AI-Generated Summary