ChatPaper.aiChatPaper

EmbodiedGen: Op weg naar een generatieve 3D-wereldengine voor belichaamde intelligentie

EmbodiedGen: Towards a Generative 3D World Engine for Embodied Intelligence

June 12, 2025
Auteurs: Wang Xinjie, Liu Liu, Cao Yu, Wu Ruiqi, Qin Wenkang, Wang Dehui, Sui Wei, Su Zhizhong
cs.AI

Samenvatting

Het construeren van een fysiek realistisch en nauwkeurig geschaalde gesimuleerde 3D-wereld is cruciaal voor de training en evaluatie van taken voor belichaamde intelligentie. De diversiteit, realisme, lage kosten, toegankelijkheid en betaalbaarheid van 3D-data-assets zijn essentieel voor het bereiken van generalisatie en schaalbaarheid in belichaamde AI. De meeste huidige taken voor belichaamde intelligentie zijn echter nog steeds sterk afhankelijk van traditionele 3D-computergraphics-assets die handmatig zijn gemaakt en geannoteerd, wat gepaard gaat met hoge productiekosten en beperkt realisme. Deze beperkingen belemmeren de schaalbaarheid van data-gedreven benaderingen aanzienlijk. Wij presenteren EmbodiedGen, een fundamenteel platform voor de interactieve generatie van 3D-werelden. Het maakt de schaalbare generatie mogelijk van hoogwaardige, controleerbare en fotorealistische 3D-assets met nauwkeurige fysieke eigenschappen en realistische schaal in het Unified Robotics Description Format (URDF) tegen lage kosten. Deze assets kunnen direct worden geïmporteerd in verschillende fysica-simulatie-engines voor fijnmazige fysieke controle, wat ondersteuning biedt voor downstream taken in training en evaluatie. EmbodiedGen is een gebruiksvriendelijke, volledig uitgeruste toolkit die bestaat uit zes belangrijke modules: Image-to-3D, Text-to-3D, Texture Generation, Articulated Object Generation, Scene Generation en Layout Generation. EmbodiedGen genereert diverse en interactieve 3D-werelden die bestaan uit generatieve 3D-assets, waarbij gebruik wordt gemaakt van generatieve AI om de uitdagingen van generalisatie en evaluatie aan te pakken in lijn met de behoeften van onderzoek gerelateerd aan belichaamde intelligentie. Code is beschikbaar op https://horizonrobotics.github.io/robot_lab/embodied_gen/index.html.
English
Constructing a physically realistic and accurately scaled simulated 3D world is crucial for the training and evaluation of embodied intelligence tasks. The diversity, realism, low cost accessibility and affordability of 3D data assets are critical for achieving generalization and scalability in embodied AI. However, most current embodied intelligence tasks still rely heavily on traditional 3D computer graphics assets manually created and annotated, which suffer from high production costs and limited realism. These limitations significantly hinder the scalability of data driven approaches. We present EmbodiedGen, a foundational platform for interactive 3D world generation. It enables the scalable generation of high-quality, controllable and photorealistic 3D assets with accurate physical properties and real-world scale in the Unified Robotics Description Format (URDF) at low cost. These assets can be directly imported into various physics simulation engines for fine-grained physical control, supporting downstream tasks in training and evaluation. EmbodiedGen is an easy-to-use, full-featured toolkit composed of six key modules: Image-to-3D, Text-to-3D, Texture Generation, Articulated Object Generation, Scene Generation and Layout Generation. EmbodiedGen generates diverse and interactive 3D worlds composed of generative 3D assets, leveraging generative AI to address the challenges of generalization and evaluation to the needs of embodied intelligence related research. Code is available at https://horizonrobotics.github.io/robot_lab/embodied_gen/index.html.
PDF22June 13, 2025