TripoSR : Reconstruction rapide d'objets 3D à partir d'une seule image
TripoSR: Fast 3D Object Reconstruction from a Single Image
March 4, 2024
Auteurs: Dmitry Tochilkin, David Pankratz, Zexiang Liu, Zixuan Huang, Adam Letts, Yangguang Li, Ding Liang, Christian Laforte, Varun Jampani, Yan-Pei Cao
cs.AI
Résumé
Ce rapport technique présente TripoSR, un modèle de reconstruction 3D
exploitant l'architecture transformer pour une génération 3D rapide en
propagation avant, produisant un maillage 3D à partir d'une seule image en
moins de 0,5 seconde. S'appuyant sur l'architecture du réseau LRM, TripoSR
intègre des améliorations substantielles dans le traitement des données, la
conception du modèle et les techniques d'apprentissage. Les évaluations sur
des jeux de données publics montrent que TripoSR présente des performances
supérieures, à la fois quantitativement et qualitativement, par rapport aux
autres alternatives open source. Distribué sous licence MIT, TripoSR vise à
doter les chercheurs, développeurs et créatifs des dernières avancées en
intelligence artificielle générative 3D.
English
This technical report introduces TripoSR, a 3D reconstruction model
leveraging transformer architecture for fast feed-forward 3D generation,
producing 3D mesh from a single image in under 0.5 seconds. Building upon the
LRM network architecture, TripoSR integrates substantial improvements in data
processing, model design, and training techniques. Evaluations on public
datasets show that TripoSR exhibits superior performance, both quantitatively
and qualitatively, compared to other open-source alternatives. Released under
the MIT license, TripoSR is intended to empower researchers, developers, and
creatives with the latest advancements in 3D generative AI.