ViSTA-SLAM: 대칭적 이중 뷰 연계를 통한 시각적 SLAM
ViSTA-SLAM: Visual SLAM with Symmetric Two-view Association
September 1, 2025
저자: Ganlin Zhang, Shenhan Qian, Xi Wang, Daniel Cremers
cs.AI
초록
카메라 내부 파라미터가 필요 없는 실시간 단안 시각 SLAM 시스템인 ViSTA-SLAM을 소개한다. 이 시스템은 다양한 카메라 설정에 폭넓게 적용 가능하다. 핵심적으로, 시스템은 경량화된 대칭적 이중 뷰 연관성(STA) 모델을 프론트엔드로 사용하며, 이 모델은 두 개의 RGB 이미지로부터 상대적인 카메라 포즈를 추정하고 로컬 포인트맵을 회귀한다. 이러한 설계는 모델 복잡도를 크게 줄여, 프론트엔드의 크기가 최신 기술 대비 35%에 불과하면서도 파이프라인에서 사용되는 이중 뷰 제약 조건의 품질을 향상시킨다. 백엔드에서는 누적된 드리프트를 해결하기 위해 루프 클로저를 통합한 특수 설계된 Sim(3) 포즈 그래프를 구성한다. 광범위한 실험을 통해, 본 접근법이 카메라 추적 및 고밀도 3D 재구성 품질 모두에서 현재의 방법들보다 우수한 성능을 달성함을 입증한다. Github 저장소: https://github.com/zhangganlin/vista-slam
English
We present ViSTA-SLAM as a real-time monocular visual SLAM system that
operates without requiring camera intrinsics, making it broadly applicable
across diverse camera setups. At its core, the system employs a lightweight
symmetric two-view association (STA) model as the frontend, which
simultaneously estimates relative camera poses and regresses local pointmaps
from only two RGB images. This design reduces model complexity significantly,
the size of our frontend is only 35\% that of comparable state-of-the-art
methods, while enhancing the quality of two-view constraints used in the
pipeline. In the backend, we construct a specially designed Sim(3) pose graph
that incorporates loop closures to address accumulated drift. Extensive
experiments demonstrate that our approach achieves superior performance in both
camera tracking and dense 3D reconstruction quality compared to current
methods. Github repository: https://github.com/zhangganlin/vista-slam