Sterke Baseline: Multi-UAV Tracking via YOLOv12 met BoT-SORT-ReID
Strong Baseline: Multi-UAV Tracking via YOLOv12 with BoT-SORT-ReID
March 21, 2025
Auteurs: Yu-Hsi Chen
cs.AI
Samenvatting
Het detecteren en volgen van meerdere onbemande luchtvaartuigen (UAV's) in thermische infraroodvideo's is van nature uitdagend vanwege het lage contrast, omgevingsruis en de kleine doelgroottes. Dit artikel biedt een eenvoudige aanpak om het volgen van meerdere UAV's in thermische infraroodvideo's aan te pakken, waarbij gebruik wordt gemaakt van recente vooruitgang in detectie en tracking. In plaats van te vertrouwen op de YOLOv5 met de DeepSORT-pipeline, presenteren we een trackingframework gebouwd op YOLOv12 en BoT-SORT, versterkt met op maat gemaakte trainings- en inferentiestrategieën. We evalueren onze aanpak aan de hand van de metrieken van de 4e Anti-UAV Challenge en laten competitieve prestaties zien. Opmerkelijk is dat we sterke resultaten behalen zonder gebruik te maken van contrastverbetering of tijdelijke informatie-fusie om UAV-kenmerken te verrijken, wat onze aanpak benadrukt als een "Sterke Basis" voor de taak van het volgen van meerdere UAV's. We bieden implementatiedetails, diepgaande experimentele analyse en een discussie over mogelijke verbeteringen. De code is beschikbaar op https://github.com/wish44165/YOLOv12-BoT-SORT-ReID.
English
Detecting and tracking multiple unmanned aerial vehicles (UAVs) in thermal
infrared video is inherently challenging due to low contrast, environmental
noise, and small target sizes. This paper provides a straightforward approach
to address multi-UAV tracking in thermal infrared video, leveraging recent
advances in detection and tracking. Instead of relying on the YOLOv5 with the
DeepSORT pipeline, we present a tracking framework built on YOLOv12 and
BoT-SORT, enhanced with tailored training and inference strategies. We evaluate
our approach following the metrics from the 4th Anti-UAV Challenge and
demonstrate competitive performance. Notably, we achieve strong results without
using contrast enhancement or temporal information fusion to enrich UAV
features, highlighting our approach as a "Strong Baseline" for the multi-UAV
tracking task. We provide implementation details, in-depth experimental
analysis, and a discussion of potential improvements. The code is available at
https://github.com/wish44165/YOLOv12-BoT-SORT-ReID .Summary
AI-Generated Summary