ChatPaper.aiChatPaper

Guardianes del Cabello: Rescate de Bordes Suaves en Profundidad, Estéreo y Vistas Novedosas

Guardians of the Hair: Rescuing Soft Boundaries in Depth, Stereo, and Novel Views

January 6, 2026
Autores: Xiang Zhang, Yang Zhang, Lukas Mehl, Markus Gross, Christopher Schroers
cs.AI

Resumen

Los límites suaves, como cabellos finos, son comúnmente observados en imágenes naturales y generadas por computadora, pero siguen siendo un desafío para la visión 3D debido a la ambigua mezcla de indicios de primer plano y fondo. Este artículo presenta Guardians of the Hair (HairGuard), un marco diseñado para recuperar detalles de límites suaves de grano fino en tareas de visión 3D. Específicamente, primero proponemos una novedosa canalización de curación de datos que aprovecha conjuntos de datos de recorte de imágenes para el entrenamiento y diseñamos una red fijadora de profundidad para identificar automáticamente regiones de límites suaves. Con un módulo residual con compuerta, el fijador de profundidad refina la profundidad con precisión alrededor de los límites suaves mientras mantiene la calidad de la profundidad global, permitiendo una integración plug-and-play con modelos de profundidad de vanguardia. Para la síntesis de vistas, realizamos un warping hacia adelante basado en profundidad para retener texturas de alta fidelidad, seguido de un pintor generativo de escenas que rellena regiones desocludidas y elimina artefactos de fondo redundantes dentro de los límites suaves. Finalmente, un fusionador de color combina adaptativamente los resultados deformados e inpintados para producir nuevas vistas con geometría consistente y detalles de grano fino. Experimentos exhaustivos demuestran que HairGuard logra un rendimiento de vanguardia en estimación de profundidad monocular, conversión de imágenes/vídeo estéreo y síntesis de nuevas vistas, con mejoras significativas en regiones de límites suaves.
English
Soft boundaries, like thin hairs, are commonly observed in natural and computer-generated imagery, but they remain challenging for 3D vision due to the ambiguous mixing of foreground and background cues. This paper introduces Guardians of the Hair (HairGuard), a framework designed to recover fine-grained soft boundary details in 3D vision tasks. Specifically, we first propose a novel data curation pipeline that leverages image matting datasets for training and design a depth fixer network to automatically identify soft boundary regions. With a gated residual module, the depth fixer refines depth precisely around soft boundaries while maintaining global depth quality, allowing plug-and-play integration with state-of-the-art depth models. For view synthesis, we perform depth-based forward warping to retain high-fidelity textures, followed by a generative scene painter that fills disoccluded regions and eliminates redundant background artifacts within soft boundaries. Finally, a color fuser adaptively combines warped and inpainted results to produce novel views with consistent geometry and fine-grained details. Extensive experiments demonstrate that HairGuard achieves state-of-the-art performance across monocular depth estimation, stereo image/video conversion, and novel view synthesis, with significant improvements in soft boundary regions.
PDF21January 10, 2026