TripoSR: 단일 이미지로부터의 빠른 3D 객체 재구성
TripoSR: Fast 3D Object Reconstruction from a Single Image
March 4, 2024
저자: Dmitry Tochilkin, David Pankratz, Zexiang Liu, Zixuan Huang, Adam Letts, Yangguang Li, Ding Liang, Christian Laforte, Varun Jampani, Yan-Pei Cao
cs.AI
초록
본 기술 보고서는 트랜스포머 아키텍처를 활용하여 빠른 피드포워드 3D 생성을 가능하게 하는 TripoSR 3D 재구성 모델을 소개한다. 이 모델은 단일 이미지로부터 0.5초 이내에 3D 메시를 생성한다. LRM 네트워크 아키텍처를 기반으로 구축된 TripoSR은 데이터 처리, 모델 설계, 훈련 기법에서 상당한 개선을 통합하였다. 공개 데이터셋에 대한 평가 결과, TripoSR은 다른 오픈소스 대안들에 비해 정량적 및 정성적으로 우수한 성능을 보여준다. MIT 라이선스 하에 공개된 TripoSR은 연구자, 개발자, 창작자들이 3D 생성 AI의 최신 기술을 활용할 수 있도록 지원하기 위해 개발되었다.
English
This technical report introduces TripoSR, a 3D reconstruction model
leveraging transformer architecture for fast feed-forward 3D generation,
producing 3D mesh from a single image in under 0.5 seconds. Building upon the
LRM network architecture, TripoSR integrates substantial improvements in data
processing, model design, and training techniques. Evaluations on public
datasets show that TripoSR exhibits superior performance, both quantitatively
and qualitatively, compared to other open-source alternatives. Released under
the MIT license, TripoSR is intended to empower researchers, developers, and
creatives with the latest advancements in 3D generative AI.