ChatPaper.aiChatPaper

PhysTwin : Reconstruction et simulation basées sur la physique d'objets déformables à partir de vidéos

PhysTwin: Physics-Informed Reconstruction and Simulation of Deformable Objects from Videos

March 23, 2025
Auteurs: Hanxiao Jiang, Hao-Yu Hsu, Kaifeng Zhang, Hsin-Ni Yu, Shenlong Wang, Yunzhu Li
cs.AI

Résumé

La création d'un jumeau numérique physique d'un objet du monde réel présente un immense potentiel dans les domaines de la robotique, de la création de contenu et de la réalité étendue (XR). Dans cet article, nous présentons PhysTwin, un nouveau cadre qui utilise des vidéos éparses d'objets dynamiques en interaction pour produire une réplique virtuelle interactive en temps réel, à la fois photoréaliste et physiquement réaliste. Notre approche repose sur deux composants clés : (1) une représentation informée par la physique qui combine des modèles masse-ressort pour une simulation physique réaliste, des modèles génératifs de forme pour la géométrie, et des splats gaussiens pour le rendu ; et (2) un nouveau cadre de modélisation inverse basé sur l'optimisation en plusieurs étapes qui reconstruit la géométrie complète, infère des propriétés physiques denses et reproduit l'apparence réaliste à partir de vidéos. Notre méthode intègre un cadre de physique inverse avec des indices de perception visuelle, permettant une reconstruction haute fidélité même à partir de points de vue partiels, occlus et limités. PhysTwin prend en charge la modélisation de divers objets déformables, notamment des cordes, des peluches, des tissus et des colis. Les expériences montrent que PhysTwin surpasse les méthodes concurrentes en matière de reconstruction, de rendu, de prédiction future et de simulation sous de nouvelles interactions. Nous démontrons en outre ses applications dans la simulation interactive en temps réel et la planification de mouvements robotiques basée sur des modèles.
English
Creating a physical digital twin of a real-world object has immense potential in robotics, content creation, and XR. In this paper, we present PhysTwin, a novel framework that uses sparse videos of dynamic objects under interaction to produce a photo- and physically realistic, real-time interactive virtual replica. Our approach centers on two key components: (1) a physics-informed representation that combines spring-mass models for realistic physical simulation, generative shape models for geometry, and Gaussian splats for rendering; and (2) a novel multi-stage, optimization-based inverse modeling framework that reconstructs complete geometry, infers dense physical properties, and replicates realistic appearance from videos. Our method integrates an inverse physics framework with visual perception cues, enabling high-fidelity reconstruction even from partial, occluded, and limited viewpoints. PhysTwin supports modeling various deformable objects, including ropes, stuffed animals, cloth, and delivery packages. Experiments show that PhysTwin outperforms competing methods in reconstruction, rendering, future prediction, and simulation under novel interactions. We further demonstrate its applications in interactive real-time simulation and model-based robotic motion planning.

Summary

AI-Generated Summary

PDF72March 26, 2025