ChatPaper.aiChatPaper

MeshFleet: Gefilterd en Geannoteerd 3D Voertuigdataset voor Domeinspecifiek Generatief Modelleren

MeshFleet: Filtered and Annotated 3D Vehicle Dataset for Domain Specific Generative Modeling

March 18, 2025
Auteurs: Damian Boborzi, Phillip Mueller, Jonas Emrich, Dominik Schmid, Sebastian Mueller, Lars Mikelsons
cs.AI

Samenvatting

Generatieve modellen hebben recentelijk opmerkelijke vooruitgang geboekt op het gebied van 3D-objecten. Hun praktische toepassing in vakgebieden zoals engineering blijft echter beperkt, omdat ze niet de vereiste nauwkeurigheid, kwaliteit en beheersbaarheid bieden die nodig zijn voor domeinspecifieke taken. Het finetunen van grote generatieve modellen is een veelbelovend perspectief om deze modellen in deze vakgebieden beschikbaar te maken. Het creëren van hoogwaardige, domeinspecifieke 3D-datasets is cruciaal voor het finetunen van grote generatieve modellen, maar het proces van datafiltering en annotatie blijft een belangrijk knelpunt. Wij presenteren MeshFleet, een gefilterd en geannoteerd 3D-voertuigdataset geëxtraheerd uit Objaverse-XL, de meest uitgebreide openbaar beschikbare verzameling van 3D-objecten. Onze aanpak stelt een pijplijn voor voor geautomatiseerde datafiltering op basis van een kwaliteitsclassificator. Deze classificator is getraind op een handmatig gelabelde subset van Objaverse, waarbij DINOv2- en SigLIP-embeddings worden geïntegreerd, verfijnd door op captions gebaseerde analyse en onzekerheidsschatting. Wij tonen de effectiviteit van onze filtermethode aan door middel van een vergelijkende analyse tegen op captions en esthetische beeldscore gebaseerde technieken en finetuningsexperimenten met SV3D, waarbij het belang van gerichte dataselectie voor domeinspecifieke 3D-generatieve modellering wordt benadrukt.
English
Generative models have recently made remarkable progress in the field of 3D objects. However, their practical application in fields like engineering remains limited since they fail to deliver the accuracy, quality, and controllability needed for domain-specific tasks. Fine-tuning large generative models is a promising perspective for making these models available in these fields. Creating high-quality, domain-specific 3D datasets is crucial for fine-tuning large generative models, yet the data filtering and annotation process remains a significant bottleneck. We present MeshFleet, a filtered and annotated 3D vehicle dataset extracted from Objaverse-XL, the most extensive publicly available collection of 3D objects. Our approach proposes a pipeline for automated data filtering based on a quality classifier. This classifier is trained on a manually labeled subset of Objaverse, incorporating DINOv2 and SigLIP embeddings, refined through caption-based analysis and uncertainty estimation. We demonstrate the efficacy of our filtering method through a comparative analysis against caption and image aesthetic score-based techniques and fine-tuning experiments with SV3D, highlighting the importance of targeted data selection for domain-specific 3D generative modeling.

Summary

AI-Generated Summary

PDF32March 19, 2025