Base de référence solide : Suivi multi-drones via YOLOv12 avec BoT-SORT-ReID
Strong Baseline: Multi-UAV Tracking via YOLOv12 with BoT-SORT-ReID
March 21, 2025
Auteurs: Yu-Hsi Chen
cs.AI
Résumé
La détection et le suivi de multiples véhicules aériens sans pilote (UAV) dans des vidéos infrarouges thermiques sont intrinsèquement complexes en raison du faible contraste, du bruit environnemental et de la petite taille des cibles. Cet article propose une approche simple pour aborder le suivi multi-UAV dans les vidéos infrarouges thermiques, en tirant parti des avancées récentes en matière de détection et de suivi. Plutôt que de s'appuyer sur le pipeline YOLOv5 avec DeepSORT, nous présentons un cadre de suivi basé sur YOLOv12 et BoT-SORT, amélioré par des stratégies d'entraînement et d'inférence adaptées. Nous évaluons notre approche en suivant les métriques du 4e Anti-UAV Challenge et démontrons des performances compétitives. Notamment, nous obtenons des résultats solides sans utiliser d'amélioration de contraste ni de fusion d'informations temporelles pour enrichir les caractéristiques des UAV, ce qui souligne notre approche comme une "Base de Référence Solide" pour la tâche de suivi multi-UAV. Nous fournissons des détails d'implémentation, une analyse expérimentale approfondie et une discussion sur les améliorations potentielles. Le code est disponible à l'adresse https://github.com/wish44165/YOLOv12-BoT-SORT-ReID.
English
Detecting and tracking multiple unmanned aerial vehicles (UAVs) in thermal
infrared video is inherently challenging due to low contrast, environmental
noise, and small target sizes. This paper provides a straightforward approach
to address multi-UAV tracking in thermal infrared video, leveraging recent
advances in detection and tracking. Instead of relying on the YOLOv5 with the
DeepSORT pipeline, we present a tracking framework built on YOLOv12 and
BoT-SORT, enhanced with tailored training and inference strategies. We evaluate
our approach following the metrics from the 4th Anti-UAV Challenge and
demonstrate competitive performance. Notably, we achieve strong results without
using contrast enhancement or temporal information fusion to enrich UAV
features, highlighting our approach as a "Strong Baseline" for the multi-UAV
tracking task. We provide implementation details, in-depth experimental
analysis, and a discussion of potential improvements. The code is available at
https://github.com/wish44165/YOLOv12-BoT-SORT-ReID .Summary
AI-Generated Summary