ChatPaper.aiChatPaper

FlyPose: Verso una Robusta Stima della Postura Umana da Viste Aeree

FlyPose: Towards Robust Human Pose Estimation From Aerial Views

January 9, 2026
Autori: Hassaan Farooq, Marvin Brenner, Peter St\ütz
cs.AI

Abstract

I veicoli aerei senza pilota (UAV) sono sempre più impiegati in prossimità di esseri umani per applicazioni come la consegna di pacchi, il monitoraggio del traffico, la risposta ai disastri e le ispezioni alle infrastrutture. Garantire un funzionamento sicuro e affidabile in questi ambienti popolati da persone richiede una percezione accurata delle pose e delle azioni umane da una prospettiva aerea. Questa prospettiva mette alla prova i metodi esistenti a causa della bassa risoluzione, degli angoli di visuale ripidi e delle (auto)occlusioni, specialmente se l'applicazione richiede modelli fattibili in tempo reale. Addestriamo e implementiamo FlyPose, una pipeline leggera per la stima della posa umana di tipo "top-down" per le immagini aeree. Attraverso un addestramento multi-dataset, otteniamo un miglioramento medio di 6,8 mAP nella rilevazione di persone sui set di test di Manipal-UAV, VisDrone, HIT-UAV e sul nostro dataset personalizzato. Per la stima della posa umana 2D riportiamo un miglioramento di 16,3 mAP sul complesso dataset UAV-Human. FlyPose opera con una latenza di inferenza di circa 20 millisecondi, inclusa la pre-elaborazione, su una Jetson Orin AGX Developer Kit ed è implementato a bordo di un UAV quadrirotore durante esperimenti di volo. Pubbliciamo inoltre FlyPose-104, un dataset piccolo ma impegnativo per la stima della posa umana da prospettiva aerea, che include annotazioni manuali da angolazioni aeree difficili: https://github.com/farooqhassaan/FlyPose.
English
Unmanned Aerial Vehicles (UAVs) are increasingly deployed in close proximity to humans for applications such as parcel delivery, traffic monitoring, disaster response and infrastructure inspections. Ensuring safe and reliable operation in these human-populated environments demands accurate perception of human poses and actions from an aerial viewpoint. This perspective challenges existing methods with low resolution, steep viewing angles and (self-)occlusion, especially if the application demands realtime feasibile models. We train and deploy FlyPose, a lightweight top-down human pose estimation pipeline for aerial imagery. Through multi-dataset training, we achieve an average improvement of 6.8 mAP in person detection across the test-sets of Manipal-UAV, VisDrone, HIT-UAV as well as our custom dataset. For 2D human pose estimation we report an improvement of 16.3 mAP on the challenging UAV-Human dataset. FlyPose runs with an inference latency of ~20 milliseconds including preprocessing on a Jetson Orin AGX Developer Kit and is deployed onboard a quadrotor UAV during flight experiments. We also publish FlyPose-104, a small but challenging aerial human pose estimation dataset, that includes manual annotations from difficult aerial perspectives: https://github.com/farooqhassaan/FlyPose.
PDF22March 16, 2026