미니멀리스트 시각 관성 오도메트리
Minimalist Visual Inertial Odometry
May 19, 2026
저자: Francesco Pasti, Jeremy Klotz, Nicola Bellotto, Shree K. Nayar
cs.AI
초록
시각-관성 오도메트리(VIO)는 이동 로봇 항법에 필수적이며, 많은 수의 픽셀을 가진 카메라를 사용한다. 카메라 이미지를 캡처하고 처리하는 데는 상당한 자원이 필요하다. 본 연구는 평면 오도메트리에 대한 최소주의적 접근법을 제시하며, 단 4개의 시각 측정값과 IMU만으로도 차동 구동 로봇의 강건한 움직임 추정이 가능함을 보여준다. 핵심 통찰은 광학적 가보 마스크를 통해 세계를 감지하는 4개의 하향 포토다이오드가 속도를 인코딩하는 신호를 생성한다는 점이다. 이를 바탕으로 물리 기반 시뮬레이터를 사용하여 가보 마스크 파라미터와 시간적 컨볼루션 네트워크(TCN)를 공동 최적화한다. 결과 모델은 포토다이오드가 생성한 4개의 측정값만으로 속도를 디코딩한다. 이 추정값을 IMU의 각속도와 결합하면 연속적인 평면 궤적을 얻을 수 있다. 우리는 차동 구동 로봇에 장착된 프로토타입 센서로 접근법을 검증한다. 다양한 실내외 지형에서 시스템은 실제 환경 미세 조정 없이 기준 실측값을 밀접하게 추적한다. 본 연구는 최소주의적 센싱이 효율적이고 정확한 평면 오도메트리를 가능하게 함을 보여준다.
English
Visual-Inertial Odometry(VIO), which is critical to mobile robot navigation, uses cameras with a large number of pixels. Capturing and processing camera images requires significant resources. This work presents a minimalist approach to planar odometry, demonstrating that just four visual measurements and an IMU can provide robust motion estimation for differential-drive robots. Our key insight is that four downward-facing photodiodes that sense the world through optical Gabor masks produce signals that encode speed. Based on this, we jointly optimize the mask parameters alongside a Temporal Convolutional Network (TCN) using a physically-grounded simulator. The resulting model decodes speed from just the four measurements produced by the photodiodes. Pairing these estimates with the angular speed from an IMU yields a continuous planar trajectory. We validate our approach with a prototype sensor mounted on a differential drive robot. Across diverse indoor and outdoor terrains, our system closely tracks the reference ground truth without any real-world fine-tuning. Our work shows that minimalist sensing enables efficient and accurate planar odometry.