Light4D : Relighting de vidéos 4D en vue extrême sans apprentissage
Light4D: Training-Free Extreme Viewpoint 4D Video Relighting
February 12, 2026
papers.authors: Zhenghuang Wu, Kang Chen, Zeyu Zhang, Hao Tang
cs.AI
papers.abstract
Les récents progrès des modèles génératifs basés sur la diffusion ont établi un nouveau paradigme pour le rééclairage d'images et de vidéos. Cependant, l'extension de ces capacités au rééclairage 4D reste un défi, principalement en raison de la rareté des données d'apprentissage appariées pour le rééclairage 4D et de la difficulté à maintenir la cohérence temporelle lors de changements de viewpoint extrêmes. Dans ce travail, nous proposons Light4D, un nouveau cadre d'apprentissage sans entraînement conçu pour synthétiser des vidéos 4D cohérentes sous un éclairage cible, même lors de changements de viewpoint extrêmes. Premièrement, nous introduisons le « Disentangled Flow Guidance », une stratégie prenant en compte le temps qui injecte efficacement le contrôle de l'éclairage dans l'espace latent tout en préservant l'intégrité géométrique. Deuxièmement, pour renforcer la cohérence temporelle, nous développons une « Temporal Consistent Attention » au sein de l'architecture IC-Light et incorporons en outre une régularisation déterministe pour éliminer le scintillement d'apparence. Des expériences approfondies démontrent que notre méthode atteint des performances compétitives en matière de cohérence temporelle et de fidélité de l'éclairage, gérant robustement des rotations de caméra allant de -90° à 90°. Code : https://github.com/AIGeeksGroup/Light4D. Site web : https://aigeeksgroup.github.io/Light4D.
English
Recent advances in diffusion-based generative models have established a new paradigm for image and video relighting. However, extending these capabilities to 4D relighting remains challenging, due primarily to the scarcity of paired 4D relighting training data and the difficulty of maintaining temporal consistency across extreme viewpoints. In this work, we propose Light4D, a novel training-free framework designed to synthesize consistent 4D videos under target illumination, even under extreme viewpoint changes. First, we introduce Disentangled Flow Guidance, a time-aware strategy that effectively injects lighting control into the latent space while preserving geometric integrity. Second, to reinforce temporal consistency, we develop Temporal Consistent Attention within the IC-Light architecture and further incorporate deterministic regularization to eliminate appearance flickering. Extensive experiments demonstrate that our method achieves competitive performance in temporal consistency and lighting fidelity, robustly handling camera rotations from -90 to 90. Code: https://github.com/AIGeeksGroup/Light4D. Website: https://aigeeksgroup.github.io/Light4D.