TripoSR: Быстрая трехмерная реконструкция объекта из одного изображения
TripoSR: Fast 3D Object Reconstruction from a Single Image
March 4, 2024
Авторы: Dmitry Tochilkin, David Pankratz, Zexiang Liu, Zixuan Huang, Adam Letts, Yangguang Li, Ding Liang, Christian Laforte, Varun Jampani, Yan-Pei Cao
cs.AI
Аннотация
Данный технический отчет представляет TripoSR, модель трехмерной реконструкции, использующую архитектуру трансформера для быстрой генерации трехмерных данных в прямом направлении, создающую трехмерную сетку из одного изображения менее чем за 0.5 секунды. На основе архитектуры сети LRM, TripoSR интегрирует существенные улучшения в обработке данных, дизайне модели и методах обучения. Оценки на общедоступных наборах данных показывают, что TripoSR демонстрирует превосходное качество работы как количественно, так и качественно, по сравнению с другими альтернативами с открытым исходным кодом. Выпущенный под лицензией MIT, TripoSR призван предоставить исследователям, разработчикам и творческим специалистам последние достижения в области трехмерного генеративного искусственного интеллекта.
English
This technical report introduces TripoSR, a 3D reconstruction model
leveraging transformer architecture for fast feed-forward 3D generation,
producing 3D mesh from a single image in under 0.5 seconds. Building upon the
LRM network architecture, TripoSR integrates substantial improvements in data
processing, model design, and training techniques. Evaluations on public
datasets show that TripoSR exhibits superior performance, both quantitatively
and qualitatively, compared to other open-source alternatives. Released under
the MIT license, TripoSR is intended to empower researchers, developers, and
creatives with the latest advancements in 3D generative AI.