ChatPaper.aiChatPaper

PhysTwin: Reconstrução e Simulação Baseada em Física de Objetos Deformáveis a partir de Vídeos

PhysTwin: Physics-Informed Reconstruction and Simulation of Deformable Objects from Videos

March 23, 2025
Autores: Hanxiao Jiang, Hao-Yu Hsu, Kaifeng Zhang, Hsin-Ni Yu, Shenlong Wang, Yunzhu Li
cs.AI

Resumo

Criar um gêmeo digital físico de um objeto do mundo real tem um potencial imenso em robótica, criação de conteúdo e XR. Neste artigo, apresentamos o PhysTwin, uma nova estrutura que utiliza vídeos esparsos de objetos dinâmicos sob interação para produzir uma réplica virtual interativa em tempo real, fotorealista e fisicamente realista. Nossa abordagem centra-se em dois componentes principais: (1) uma representação informada por física que combina modelos de massa-mola para simulação física realista, modelos generativos de forma para geometria e splats gaussianos para renderização; e (2) uma nova estrutura de modelagem inversa baseada em otimização em múltiplos estágios que reconstrói a geometria completa, infere propriedades físicas densas e replica a aparência realista a partir de vídeos. Nosso método integra uma estrutura de física inversa com pistas de percepção visual, permitindo reconstrução de alta fidelidade mesmo a partir de visões parciais, ocluídas e limitadas. O PhysTwin suporta a modelagem de vários objetos deformáveis, incluindo cordas, bichos de pelúcia, tecidos e pacotes de entrega. Experimentos mostram que o PhysTwin supera métodos concorrentes em reconstrução, renderização, previsão futura e simulação sob novas interações. Além disso, demonstramos suas aplicações em simulação interativa em tempo real e planejamento de movimento robótico baseado em modelo.
English
Creating a physical digital twin of a real-world object has immense potential in robotics, content creation, and XR. In this paper, we present PhysTwin, a novel framework that uses sparse videos of dynamic objects under interaction to produce a photo- and physically realistic, real-time interactive virtual replica. Our approach centers on two key components: (1) a physics-informed representation that combines spring-mass models for realistic physical simulation, generative shape models for geometry, and Gaussian splats for rendering; and (2) a novel multi-stage, optimization-based inverse modeling framework that reconstructs complete geometry, infers dense physical properties, and replicates realistic appearance from videos. Our method integrates an inverse physics framework with visual perception cues, enabling high-fidelity reconstruction even from partial, occluded, and limited viewpoints. PhysTwin supports modeling various deformable objects, including ropes, stuffed animals, cloth, and delivery packages. Experiments show that PhysTwin outperforms competing methods in reconstruction, rendering, future prediction, and simulation under novel interactions. We further demonstrate its applications in interactive real-time simulation and model-based robotic motion planning.
PDF82March 26, 2025