ChatPaper.aiChatPaper

TripoSR: 단일 이미지로부터의 빠른 3D 객체 재구성

TripoSR: Fast 3D Object Reconstruction from a Single Image

March 4, 2024
저자: Dmitry Tochilkin, David Pankratz, Zexiang Liu, Zixuan Huang, Adam Letts, Yangguang Li, Ding Liang, Christian Laforte, Varun Jampani, Yan-Pei Cao
cs.AI

초록

본 기술 보고서는 트랜스포머 아키텍처를 활용하여 빠른 피드포워드 3D 생성을 가능하게 하는 TripoSR 3D 재구성 모델을 소개한다. 이 모델은 단일 이미지로부터 0.5초 이내에 3D 메시를 생성한다. LRM 네트워크 아키텍처를 기반으로 구축된 TripoSR은 데이터 처리, 모델 설계, 훈련 기법에서 상당한 개선을 통합하였다. 공개 데이터셋에 대한 평가 결과, TripoSR은 다른 오픈소스 대안들에 비해 정량적 및 정성적으로 우수한 성능을 보여준다. MIT 라이선스 하에 공개된 TripoSR은 연구자, 개발자, 창작자들이 3D 생성 AI의 최신 기술을 활용할 수 있도록 지원하기 위해 개발되었다.
English
This technical report introduces TripoSR, a 3D reconstruction model leveraging transformer architecture for fast feed-forward 3D generation, producing 3D mesh from a single image in under 0.5 seconds. Building upon the LRM network architecture, TripoSR integrates substantial improvements in data processing, model design, and training techniques. Evaluations on public datasets show that TripoSR exhibits superior performance, both quantitatively and qualitatively, compared to other open-source alternatives. Released under the MIT license, TripoSR is intended to empower researchers, developers, and creatives with the latest advancements in 3D generative AI.
PDF143December 15, 2024