ChatPaper.aiChatPaper

ViSTA-SLAM: 대칭적 이중 뷰 연계를 통한 시각적 SLAM

ViSTA-SLAM: Visual SLAM with Symmetric Two-view Association

September 1, 2025
저자: Ganlin Zhang, Shenhan Qian, Xi Wang, Daniel Cremers
cs.AI

초록

카메라 내부 파라미터가 필요 없는 실시간 단안 시각 SLAM 시스템인 ViSTA-SLAM을 소개한다. 이 시스템은 다양한 카메라 설정에 폭넓게 적용 가능하다. 핵심적으로, 시스템은 경량화된 대칭적 이중 뷰 연관성(STA) 모델을 프론트엔드로 사용하며, 이 모델은 두 개의 RGB 이미지로부터 상대적인 카메라 포즈를 추정하고 로컬 포인트맵을 회귀한다. 이러한 설계는 모델 복잡도를 크게 줄여, 프론트엔드의 크기가 최신 기술 대비 35%에 불과하면서도 파이프라인에서 사용되는 이중 뷰 제약 조건의 품질을 향상시킨다. 백엔드에서는 누적된 드리프트를 해결하기 위해 루프 클로저를 통합한 특수 설계된 Sim(3) 포즈 그래프를 구성한다. 광범위한 실험을 통해, 본 접근법이 카메라 추적 및 고밀도 3D 재구성 품질 모두에서 현재의 방법들보다 우수한 성능을 달성함을 입증한다. Github 저장소: https://github.com/zhangganlin/vista-slam
English
We present ViSTA-SLAM as a real-time monocular visual SLAM system that operates without requiring camera intrinsics, making it broadly applicable across diverse camera setups. At its core, the system employs a lightweight symmetric two-view association (STA) model as the frontend, which simultaneously estimates relative camera poses and regresses local pointmaps from only two RGB images. This design reduces model complexity significantly, the size of our frontend is only 35\% that of comparable state-of-the-art methods, while enhancing the quality of two-view constraints used in the pipeline. In the backend, we construct a specially designed Sim(3) pose graph that incorporates loop closures to address accumulated drift. Extensive experiments demonstrate that our approach achieves superior performance in both camera tracking and dense 3D reconstruction quality compared to current methods. Github repository: https://github.com/zhangganlin/vista-slam
PDF51September 3, 2025