Linha de Base Forte: Rastreamento Multi-UAV via YOLOv12 com BoT-SORT-ReID
Strong Baseline: Multi-UAV Tracking via YOLOv12 with BoT-SORT-ReID
March 21, 2025
Autores: Yu-Hsi Chen
cs.AI
Resumo
A detecção e rastreamento de múltiplos veículos aéreos não tripulados (VANTs) em vídeo de infravermelho térmico é intrinsecamente desafiadora devido ao baixo contraste, ruído ambiental e ao pequeno tamanho dos alvos. Este artigo apresenta uma abordagem direta para o rastreamento de múltiplos VANTs em vídeo de infravermelho térmico, aproveitando avanços recentes em detecção e rastreamento. Em vez de depender do YOLOv5 com o pipeline DeepSORT, propomos um framework de rastreamento baseado no YOLOv12 e BoT-SORT, aprimorado com estratégias personalizadas de treinamento e inferência. Avaliamos nossa abordagem seguindo as métricas do 4º Anti-UAV Challenge e demonstramos desempenho competitivo. Notavelmente, alcançamos resultados robustos sem utilizar técnicas de aumento de contraste ou fusão de informações temporais para enriquecer as características dos VANTs, destacando nossa abordagem como uma "Linha de Base Forte" para a tarefa de rastreamento de múltiplos VANTs. Fornecemos detalhes de implementação, análise experimental aprofundada e uma discussão sobre possíveis melhorias. O código está disponível em https://github.com/wish44165/YOLOv12-BoT-SORT-ReID.
English
Detecting and tracking multiple unmanned aerial vehicles (UAVs) in thermal
infrared video is inherently challenging due to low contrast, environmental
noise, and small target sizes. This paper provides a straightforward approach
to address multi-UAV tracking in thermal infrared video, leveraging recent
advances in detection and tracking. Instead of relying on the YOLOv5 with the
DeepSORT pipeline, we present a tracking framework built on YOLOv12 and
BoT-SORT, enhanced with tailored training and inference strategies. We evaluate
our approach following the metrics from the 4th Anti-UAV Challenge and
demonstrate competitive performance. Notably, we achieve strong results without
using contrast enhancement or temporal information fusion to enrich UAV
features, highlighting our approach as a "Strong Baseline" for the multi-UAV
tracking task. We provide implementation details, in-depth experimental
analysis, and a discussion of potential improvements. The code is available at
https://github.com/wish44165/YOLOv12-BoT-SORT-ReID .Summary
AI-Generated Summary