Línea Base Fuerte: Seguimiento Multi-UAV mediante YOLOv12 con BoT-SORT-ReID
Strong Baseline: Multi-UAV Tracking via YOLOv12 with BoT-SORT-ReID
March 21, 2025
Autores: Yu-Hsi Chen
cs.AI
Resumen
La detección y seguimiento de múltiples vehículos aéreos no tripulados (UAVs) en video de infrarrojo térmico es inherentemente desafiante debido al bajo contraste, el ruido ambiental y los tamaños reducidos de los objetivos. Este artículo presenta un enfoque directo para abordar el seguimiento multi-UAV en video de infrarrojo térmico, aprovechando avances recientes en detección y seguimiento. En lugar de depender de la combinación de YOLOv5 con la canalización DeepSORT, proponemos un marco de seguimiento basado en YOLOv12 y BoT-SORT, mejorado con estrategias personalizadas de entrenamiento e inferencia. Evaluamos nuestro enfoque siguiendo las métricas del 4º Anti-UAV Challenge y demostramos un rendimiento competitivo. Destacamos que logramos resultados sólidos sin utilizar técnicas de mejora de contraste ni fusión de información temporal para enriquecer las características de los UAVs, lo que posiciona nuestro enfoque como una "Línea Base Fuerte" para la tarea de seguimiento multi-UAV. Proporcionamos detalles de implementación, un análisis experimental en profundidad y una discusión sobre posibles mejoras. El código está disponible en https://github.com/wish44165/YOLOv12-BoT-SORT-ReID.
English
Detecting and tracking multiple unmanned aerial vehicles (UAVs) in thermal
infrared video is inherently challenging due to low contrast, environmental
noise, and small target sizes. This paper provides a straightforward approach
to address multi-UAV tracking in thermal infrared video, leveraging recent
advances in detection and tracking. Instead of relying on the YOLOv5 with the
DeepSORT pipeline, we present a tracking framework built on YOLOv12 and
BoT-SORT, enhanced with tailored training and inference strategies. We evaluate
our approach following the metrics from the 4th Anti-UAV Challenge and
demonstrate competitive performance. Notably, we achieve strong results without
using contrast enhancement or temporal information fusion to enrich UAV
features, highlighting our approach as a "Strong Baseline" for the multi-UAV
tracking task. We provide implementation details, in-depth experimental
analysis, and a discussion of potential improvements. The code is available at
https://github.com/wish44165/YOLOv12-BoT-SORT-ReID .Summary
AI-Generated Summary