ChatPaper.aiChatPaper

ImageDream: 이미지 프롬프트 기반 다중 뷰 확산 모델을 활용한 3D 생성

ImageDream: Image-Prompt Multi-view Diffusion for 3D Generation

December 2, 2023
저자: Peng Wang, Yichun Shi
cs.AI

초록

"ImageDream"은 3D 객체 생성을 위한 혁신적인 이미지 프롬프트 기반의 멀티뷰 확산 모델로 소개합니다. ImageDream은 기존의 최첨단 이미지 조건 기반 방법들에 비해 더 높은 품질의 3D 모델을 생성할 수 있는 능력으로 두드러집니다. 우리의 접근 방식은 이미지 내 객체에 대해 정규화된 카메라 좌표계를 활용하여 시각적 기하학적 정확도를 향상시킵니다. 이 모델은 입력 이미지에 기반하여 확산 모델 내 각 블록에서 다양한 수준의 제어를 제공하도록 설계되었으며, 여기서 전역 제어는 객체의 전체 레이아웃을 형성하고 지역 제어는 이미지의 세부 사항을 미세 조정합니다. ImageDream의 효과는 표준 프롬프트 목록을 사용한 광범위한 평가를 통해 입증되었습니다. 더 많은 정보는 프로젝트 페이지(https://Image-Dream.github.io)를 방문하십시오.
English
We introduce "ImageDream," an innovative image-prompt, multi-view diffusion model for 3D object generation. ImageDream stands out for its ability to produce 3D models of higher quality compared to existing state-of-the-art, image-conditioned methods. Our approach utilizes a canonical camera coordination for the objects in images, improving visual geometry accuracy. The model is designed with various levels of control at each block inside the diffusion model based on the input image, where global control shapes the overall object layout and local control fine-tunes the image details. The effectiveness of ImageDream is demonstrated through extensive evaluations using a standard prompt list. For more information, visit our project page at https://Image-Dream.github.io.
PDF342December 15, 2024