ChatPaper.aiChatPaper

순차적 프록시-모션 학습을 통한 월드 공간에서의 실시간 단안 영상 기반 전신 캡처

Real-time Monocular Full-body Capture in World Space via Sequential Proxy-to-Motion Learning

July 3, 2023
저자: Yuxiang Zhang, Hongwen Zhang, Liangxiao Hu, Hongwei Yi, Shengping Zhang, Yebin Liu
cs.AI

초록

단안(monocular) 모션 캡처에 대한 학습 기반 접근법은 최근 데이터 주도 방식으로 회귀(regression)를 학습함으로써 유망한 결과를 보여주고 있다. 그러나 데이터 수집과 네트워크 설계의 어려움으로 인해, 기존 솔루션들은 세계 좌표계(world space)에서 정확하면서도 실시간 전신 캡처를 달성하는 데 여전히 어려움을 겪고 있다. 본 연구에서는 2D 골격 시퀀스와 3D 회전 모션을 포함한 프록시 데이터셋과 함께 순차적 프록시-모션 학습 기법을 제안한다. 이러한 프록시 데이터는 정확한 전신 감독(supervision)을 통해 학습 기반 네트워크를 구축할 수 있게 하며, 일반화 문제를 완화하는 데도 기여한다. 더 정확하고 물리적으로 타당한 예측을 위해, 본 네트워크에서는 발-지면 접촉과 프록시 관측치와의 모션 불일치를 인지할 수 있는 접촉 인식 신경 모션 하강(contact-aware neural motion descent) 모듈을 제안한다. 또한, 전신 모델과 더 호환 가능한 손목 자세 복구를 위해 네트워크 내에서 신체-손 컨텍스트 정보를 공유한다. 제안된 학습 기반 솔루션을 통해, 세계 좌표계에서 타당한 발-지면 접촉을 갖춘 최초의 실시간 단안 전신 캡처 시스템을 구현하였다. 더 많은 비디오 결과는 프로젝트 페이지(https://liuyebin.com/proxycap)에서 확인할 수 있다.
English
Learning-based approaches to monocular motion capture have recently shown promising results by learning to regress in a data-driven manner. However, due to the challenges in data collection and network designs, it remains challenging for existing solutions to achieve real-time full-body capture while being accurate in world space. In this work, we contribute a sequential proxy-to-motion learning scheme together with a proxy dataset of 2D skeleton sequences and 3D rotational motions in world space. Such proxy data enables us to build a learning-based network with accurate full-body supervision while also mitigating the generalization issues. For more accurate and physically plausible predictions, a contact-aware neural motion descent module is proposed in our network so that it can be aware of foot-ground contact and motion misalignment with the proxy observations. Additionally, we share the body-hand context information in our network for more compatible wrist poses recovery with the full-body model. With the proposed learning-based solution, we demonstrate the first real-time monocular full-body capture system with plausible foot-ground contact in world space. More video results can be found at our project page: https://liuyebin.com/proxycap.
PDF90December 15, 2024