ChatPaper.aiChatPaper

Base de référence solide : Suivi multi-drones via YOLOv12 avec BoT-SORT-ReID

Strong Baseline: Multi-UAV Tracking via YOLOv12 with BoT-SORT-ReID

March 21, 2025
Auteurs: Yu-Hsi Chen
cs.AI

Résumé

La détection et le suivi de multiples véhicules aériens sans pilote (UAV) dans des vidéos infrarouges thermiques sont intrinsèquement complexes en raison du faible contraste, du bruit environnemental et de la petite taille des cibles. Cet article propose une approche simple pour aborder le suivi multi-UAV dans les vidéos infrarouges thermiques, en tirant parti des avancées récentes en matière de détection et de suivi. Plutôt que de s'appuyer sur le pipeline YOLOv5 avec DeepSORT, nous présentons un cadre de suivi basé sur YOLOv12 et BoT-SORT, amélioré par des stratégies d'entraînement et d'inférence adaptées. Nous évaluons notre approche en suivant les métriques du 4e Anti-UAV Challenge et démontrons des performances compétitives. Notamment, nous obtenons des résultats solides sans utiliser d'amélioration de contraste ni de fusion d'informations temporelles pour enrichir les caractéristiques des UAV, ce qui souligne notre approche comme une "Base de Référence Solide" pour la tâche de suivi multi-UAV. Nous fournissons des détails d'implémentation, une analyse expérimentale approfondie et une discussion sur les améliorations potentielles. Le code est disponible à l'adresse https://github.com/wish44165/YOLOv12-BoT-SORT-ReID.
English
Detecting and tracking multiple unmanned aerial vehicles (UAVs) in thermal infrared video is inherently challenging due to low contrast, environmental noise, and small target sizes. This paper provides a straightforward approach to address multi-UAV tracking in thermal infrared video, leveraging recent advances in detection and tracking. Instead of relying on the YOLOv5 with the DeepSORT pipeline, we present a tracking framework built on YOLOv12 and BoT-SORT, enhanced with tailored training and inference strategies. We evaluate our approach following the metrics from the 4th Anti-UAV Challenge and demonstrate competitive performance. Notably, we achieve strong results without using contrast enhancement or temporal information fusion to enrich UAV features, highlighting our approach as a "Strong Baseline" for the multi-UAV tracking task. We provide implementation details, in-depth experimental analysis, and a discussion of potential improvements. The code is available at https://github.com/wish44165/YOLOv12-BoT-SORT-ReID .

Summary

AI-Generated Summary

PDF45March 26, 2025