ChatPaper.aiChatPaper

Reconstruction 3D temporellement cohérente d'oiseaux

Temporally-consistent 3D Reconstruction of Birds

August 24, 2024
Auteurs: Johannes Hägerlind, Jonas Hentati-Sundberg, Bastian Wandt
cs.AI

Résumé

Cet article traite de la reconstruction en 3D des oiseaux de mer qui ont récemment attiré l'attention des scientifiques de l'environnement en tant que précieux bio-indicateurs des changements environnementaux. De telles informations en 3D sont bénéfiques pour analyser le comportement et la forme physiologique des oiseaux, par exemple en suivant les mouvements, la forme et les changements d'apparence. Du point de vue de la vision par ordinateur, les oiseaux sont particulièrement difficiles en raison de leurs mouvements rapides et souvent non rigides. Nous proposons une approche pour reconstruire la pose et la forme en 3D à partir de vidéos monoclaires d'une espèce spécifique d'oiseau de mer - le guillemot de Troïl. Notre approche comprend une chaîne complète de détection, de suivi, de segmentation et de reconstruction en 3D temporellement cohérente. De plus, nous proposons une perte temporelle qui étend les estimateurs de pose d'oiseaux en 3D à partir d'images uniques au domaine temporel. De plus, nous fournissons un ensemble de données du monde réel de 10000 images vidéo en moyenne capturant neuf oiseaux simultanément, comprenant une grande variété de mouvements et d'interactions, y compris un petit ensemble de test avec des étiquettes de points clés spécifiques aux oiseaux. En utilisant notre optimisation temporelle, nous obtenons des performances de pointe pour les séquences difficiles de notre ensemble de données.
English
This paper deals with 3D reconstruction of seabirds which recently came into focus of environmental scientists as valuable bio-indicators for environmental change. Such 3D information is beneficial for analyzing the bird's behavior and physiological shape, for example by tracking motion, shape, and appearance changes. From a computer vision perspective birds are especially challenging due to their rapid and oftentimes non-rigid motions. We propose an approach to reconstruct the 3D pose and shape from monocular videos of a specific breed of seabird - the common murre. Our approach comprises a full pipeline of detection, tracking, segmentation, and temporally consistent 3D reconstruction. Additionally, we propose a temporal loss that extends current single-image 3D bird pose estimators to the temporal domain. Moreover, we provide a real-world dataset of 10000 frames of video observations on average capture nine birds simultaneously, comprising a large variety of motions and interactions, including a smaller test set with bird-specific keypoint labels. Using our temporal optimization, we achieve state-of-the-art performance for the challenging sequences in our dataset.

Summary

AI-Generated Summary

PDF51November 16, 2024