TripoSR: Reconstrucción rápida de objetos 3D a partir de una sola imagen
TripoSR: Fast 3D Object Reconstruction from a Single Image
March 4, 2024
Autores: Dmitry Tochilkin, David Pankratz, Zexiang Liu, Zixuan Huang, Adam Letts, Yangguang Li, Ding Liang, Christian Laforte, Varun Jampani, Yan-Pei Cao
cs.AI
Resumen
Este informe técnico presenta TripoSR, un modelo de reconstrucción 3D que aprovecha la arquitectura transformer para la generación rápida de modelos 3D en un solo paso, produciendo mallas 3D a partir de una sola imagen en menos de 0.5 segundos. Basándose en la arquitectura de red LRM, TripoSR incorpora mejoras significativas en el procesamiento de datos, el diseño del modelo y las técnicas de entrenamiento. Las evaluaciones en conjuntos de datos públicos muestran que TripoSR exhibe un rendimiento superior, tanto cuantitativa como cualitativamente, en comparación con otras alternativas de código abierto. Publicado bajo la licencia MIT, TripoSR tiene como objetivo empoderar a investigadores, desarrolladores y creativos con los últimos avances en IA generativa 3D.
English
This technical report introduces TripoSR, a 3D reconstruction model
leveraging transformer architecture for fast feed-forward 3D generation,
producing 3D mesh from a single image in under 0.5 seconds. Building upon the
LRM network architecture, TripoSR integrates substantial improvements in data
processing, model design, and training techniques. Evaluations on public
datasets show that TripoSR exhibits superior performance, both quantitatively
and qualitatively, compared to other open-source alternatives. Released under
the MIT license, TripoSR is intended to empower researchers, developers, and
creatives with the latest advancements in 3D generative AI.