ChatPaper.aiChatPaper

가역적 다중 레이어 이미지 생성을 위한 제어 가능한 레이어 분해

Controllable Layer Decomposition for Reversible Multi-Layer Image Generation

November 20, 2025
저자: Zihao Liu, Zunnan Xu, Shi Shu, Jun Zhou, Ruicheng Zhang, Zhenchao Tang, Xiu Li
cs.AI

초록

본 연구에서는 래스터 이미지의 세밀하고 제어 가능한 다중 레이어 분리를 달성하기 위한 방법인 Controllable Layer Decomposition(CLD)를 제안한다. 실제 작업 흐름에서 디자이너들은 일반적으로 최종 래스터 이미지로 합성하기 전에 각 RGBA 레이어를 독립적으로 생성하고 편집한다. 그러나 이 과정은 비가역적이며, 일단 합성되면 레이어 수준의 편집은 더 이상 불가능해진다. 기존 방법들은 일반적으로 이미지 매팅과 인페인팅에 의존하지만, 제어성과 분할 정밀도 측면에서 한계가 남아 있다. 이러한 문제를 해결하기 위해 우리는 두 가지 핵심 모듈을 제안한다: 이미지 요소를 별도의 레이어로 분리하고 세밀한 제어를 가능하게 하는 LayerDecompose-DiT(LD-DiT); 그리고 다중 레이어 토큰에 대상 이미지 정보를 주입하여 정확한 조건부 생성을 달성하는 Multi-Layer Conditional Adapter(MLCA)이다. 포괄적인 평가를 위해 우리는 새로운 벤치마크를 구축하고 맞춤형 평가 지표를 도입했다. 실험 결과, CLD는 분해 품질과 제어성 모두에서 기존 방법들을 지속적으로 능가하는 것으로 나타났다. 더 나아가, CLD에 의해 생성된 분리된 레이어들은 PowerPoint와 같은 일반적인 디자인 도구에서 직접 조작이 가능하여, 실제 창의적 작업 흐름에서의 실용적 가치와 적용 가능성을 부각시킨다.
English
This work presents Controllable Layer Decomposition (CLD), a method for achieving fine-grained and controllable multi-layer separation of raster images. In practical workflows, designers typically generate and edit each RGBA layer independently before compositing them into a final raster image. However, this process is irreversible: once composited, layer-level editing is no longer possible. Existing methods commonly rely on image matting and inpainting, but remain limited in controllability and segmentation precision. To address these challenges, we propose two key modules: LayerDecompose-DiT (LD-DiT), which decouples image elements into distinct layers and enables fine-grained control; and Multi-Layer Conditional Adapter (MLCA), which injects target image information into multi-layer tokens to achieve precise conditional generation. To enable a comprehensive evaluation, we build a new benchmark and introduce tailored evaluation metrics. Experimental results show that CLD consistently outperforms existing methods in both decomposition quality and controllability. Furthermore, the separated layers produced by CLD can be directly manipulated in commonly used design tools such as PowerPoint, highlighting its practical value and applicability in real-world creative workflows.
PDF92February 7, 2026