ChatPaper.aiChatPaper

NeuFlow : Estimation du flux optique en temps réel et haute précision sur les robots utilisant des dispositifs périphériques

NeuFlow: Real-time, High-accuracy Optical Flow Estimation on Robots Using Edge Devices

March 15, 2024
Auteurs: Zhiyong Zhang, Huaizu Jiang, Hanumant Singh
cs.AI

Résumé

L'estimation en temps réel du flux optique avec une grande précision est un composant crucial dans diverses applications, notamment la localisation et la cartographie en robotique, le suivi d'objets et la reconnaissance d'activités en vision par ordinateur. Bien que les méthodes récentes de flux optique basées sur l'apprentissage aient atteint une grande précision, elles s'accompagnent souvent de coûts de calcul élevés. Dans cet article, nous proposons une architecture de flux optique hautement efficace, appelée NeuFlow, qui répond à la fois aux préoccupations de précision élevée et de coût de calcul. L'architecture suit un schéma global-local. Étant donné les caractéristiques des images d'entrée extraites à différentes résolutions spatiales, une correspondance globale est utilisée pour estimer un flux optique initial à la résolution 1/16, capturant les grands déplacements, qui est ensuite affiné à la résolution 1/8 avec des couches CNN légères pour une meilleure précision. Nous évaluons notre approche sur Jetson Orin Nano et RTX 2080 pour démontrer les améliorations d'efficacité sur différentes plateformes de calcul. Nous obtenons une accélération notable de 10x à 80x par rapport à plusieurs méthodes de pointe, tout en maintenant une précision comparable. Notre approche atteint environ 30 FPS sur les plateformes de calcul en périphérie, ce qui représente une avancée significative dans le déploiement de tâches complexes de vision par ordinateur telles que SLAM sur de petits robots comme les drones. Le code complet d'entraînement et d'évaluation est disponible à l'adresse https://github.com/neufieldrobotics/NeuFlow.
English
Real-time high-accuracy optical flow estimation is a crucial component in various applications, including localization and mapping in robotics, object tracking, and activity recognition in computer vision. While recent learning-based optical flow methods have achieved high accuracy, they often come with heavy computation costs. In this paper, we propose a highly efficient optical flow architecture, called NeuFlow, that addresses both high accuracy and computational cost concerns. The architecture follows a global-to-local scheme. Given the features of the input images extracted at different spatial resolutions, global matching is employed to estimate an initial optical flow on the 1/16 resolution, capturing large displacement, which is then refined on the 1/8 resolution with lightweight CNN layers for better accuracy. We evaluate our approach on Jetson Orin Nano and RTX 2080 to demonstrate efficiency improvements across different computing platforms. We achieve a notable 10x-80x speedup compared to several state-of-the-art methods, while maintaining comparable accuracy. Our approach achieves around 30 FPS on edge computing platforms, which represents a significant breakthrough in deploying complex computer vision tasks such as SLAM on small robots like drones. The full training and evaluation code is available at https://github.com/neufieldrobotics/NeuFlow.

Summary

AI-Generated Summary

PDF41December 15, 2024