ChatPaper.aiChatPaper

ZeroShape: Regressionsbasierte Null-Shot-Formrekonstruktion

ZeroShape: Regression-based Zero-shot Shape Reconstruction

December 21, 2023
Autoren: Zixuan Huang, Stefan Stojanov, Anh Thai, Varun Jampani, James M. Rehg
cs.AI

Zusammenfassung

Wir untersuchen das Problem der 3D-Formrekonstruktion aus einem einzelnen Bild im Zero-Shot-Szenario. Aktuelle Arbeiten lernen die Zero-Shot-Formrekonstruktion durch generative Modellierung von 3D-Assets, doch diese Modelle sind sowohl im Training als auch bei der Inferenz rechenintensiv. Im Gegensatz dazu basiert der traditionelle Ansatz auf Regression, bei dem deterministische Modelle trainiert werden, um die Objektform direkt zu regressieren. Solche Regressionsmethoden sind deutlich recheneffizienter als generative Methoden. Dies wirft die naheliegende Frage auf: Ist generative Modellierung für hohe Leistung notwendig, oder sind regressionsbasierte Ansätze immer noch wettbewerbsfähig? Um dies zu beantworten, entwickeln wir ein leistungsstarkes regressionsbasiertes Modell namens ZeroShape, das auf den konvergierenden Erkenntnissen in diesem Bereich und einer neuartigen Einsicht basiert. Zudem stellen wir einen umfangreichen Evaluationsbenchmark aus der realen Welt zusammen, der Objekte aus drei verschiedenen realen 3D-Datensätzen enthält. Dieser Evaluationsbenchmark ist vielfältiger und um eine Größenordnung größer als diejenigen, die in früheren Arbeiten zur quantitativen Bewertung der Modelle verwendet wurden, mit dem Ziel, die Evaluationsvarianz in unserem Feld zu reduzieren. Wir zeigen, dass ZeroShape nicht nur eine überlegene Leistung gegenüber state-of-the-art Methoden erzielt, sondern auch eine deutlich höhere Rechen- und Dateneffizienz aufweist.
English
We study the problem of single-image zero-shot 3D shape reconstruction. Recent works learn zero-shot shape reconstruction through generative modeling of 3D assets, but these models are computationally expensive at train and inference time. In contrast, the traditional approach to this problem is regression-based, where deterministic models are trained to directly regress the object shape. Such regression methods possess much higher computational efficiency than generative methods. This raises a natural question: is generative modeling necessary for high performance, or conversely, are regression-based approaches still competitive? To answer this, we design a strong regression-based model, called ZeroShape, based on the converging findings in this field and a novel insight. We also curate a large real-world evaluation benchmark, with objects from three different real-world 3D datasets. This evaluation benchmark is more diverse and an order of magnitude larger than what prior works use to quantitatively evaluate their models, aiming at reducing the evaluation variance in our field. We show that ZeroShape not only achieves superior performance over state-of-the-art methods, but also demonstrates significantly higher computational and data efficiency.
PDF91December 15, 2024