Надежный базовый подход: Многодроновое отслеживание с использованием YOLOv12 и BoT-SORT-ReID
Strong Baseline: Multi-UAV Tracking via YOLOv12 with BoT-SORT-ReID
March 21, 2025
Авторы: Yu-Hsi Chen
cs.AI
Аннотация
Обнаружение и отслеживание нескольких беспилотных летательных аппаратов (БПЛА) в тепловизионном видео представляет собой сложную задачу из-за низкого контраста, шумов окружающей среды и малых размеров целей. В данной статье предлагается простой подход для решения задачи многократного отслеживания БПЛА в тепловизионном видео, основанный на последних достижениях в области обнаружения и отслеживания. Вместо использования YOLOv5 с конвейером DeepSORT мы представляем фреймворк для отслеживания, построенный на YOLOv12 и BoT-SORT, дополненный специализированными стратегиями обучения и вывода. Мы оцениваем наш подход, следуя метрикам 4-го Anti-UAV Challenge, и демонстрируем конкурентоспособные результаты. Важно отметить, что мы достигаем высоких показателей без использования усиления контраста или слияния временной информации для обогащения признаков БПЛА, что подчеркивает наш подход как "Сильный Базовый" для задачи многократного отслеживания БПЛА. Мы предоставляем детали реализации, углубленный анализ экспериментов и обсуждение возможных улучшений. Код доступен по адресу https://github.com/wish44165/YOLOv12-BoT-SORT-ReID.
English
Detecting and tracking multiple unmanned aerial vehicles (UAVs) in thermal
infrared video is inherently challenging due to low contrast, environmental
noise, and small target sizes. This paper provides a straightforward approach
to address multi-UAV tracking in thermal infrared video, leveraging recent
advances in detection and tracking. Instead of relying on the YOLOv5 with the
DeepSORT pipeline, we present a tracking framework built on YOLOv12 and
BoT-SORT, enhanced with tailored training and inference strategies. We evaluate
our approach following the metrics from the 4th Anti-UAV Challenge and
demonstrate competitive performance. Notably, we achieve strong results without
using contrast enhancement or temporal information fusion to enrich UAV
features, highlighting our approach as a "Strong Baseline" for the multi-UAV
tracking task. We provide implementation details, in-depth experimental
analysis, and a discussion of potential improvements. The code is available at
https://github.com/wish44165/YOLOv12-BoT-SORT-ReID .Summary
AI-Generated Summary