TripoSR: 単一画像からの高速3Dオブジェクト再構築
TripoSR: Fast 3D Object Reconstruction from a Single Image
March 4, 2024
著者: Dmitry Tochilkin, David Pankratz, Zexiang Liu, Zixuan Huang, Adam Letts, Yangguang Li, Ding Liang, Christian Laforte, Varun Jampani, Yan-Pei Cao
cs.AI
要旨
本技術レポートでは、トランスフォーマーアーキテクチャを活用した高速フィードフォワード3D生成モデルであるTripoSRを紹介する。TripoSRは、単一の画像から0.5秒未満で3Dメッシュを生成する。LRMネットワークアーキテクチャを基盤として、TripoSRはデータ処理、モデル設計、およびトレーニング技術において大幅な改善を統合している。公開データセットでの評価により、TripoSRは他のオープンソースの代替モデルと比較して、定量的および質的に優れた性能を示すことが確認された。MITライセンスの下でリリースされたTripoSRは、研究者、開発者、およびクリエイターに3D生成AIの最新の進歩を提供することを目的としている。
English
This technical report introduces TripoSR, a 3D reconstruction model
leveraging transformer architecture for fast feed-forward 3D generation,
producing 3D mesh from a single image in under 0.5 seconds. Building upon the
LRM network architecture, TripoSR integrates substantial improvements in data
processing, model design, and training techniques. Evaluations on public
datasets show that TripoSR exhibits superior performance, both quantitatively
and qualitatively, compared to other open-source alternatives. Released under
the MIT license, TripoSR is intended to empower researchers, developers, and
creatives with the latest advancements in 3D generative AI.