Disponibilidad a priori en Sim-to-Real visual industrial: una revisión de los regímenes guiados por CAD y sin disponibilidad de CAD
Prior Availability in Industrial Visual Sim-to-Real: A Review of CAD-Guided and CAD-Unavailable Regimes
May 28, 2026
Autores: Chenxi Tao, Seung-Kyum Choi
cs.AI
Resumen
La transferencia visual de simulación a realidad en entornos industriales suele describirse como el paso de imágenes sintéticas a imágenes reales, pero el despliegue industrial implica generalmente un desajuste más amplio entre la evidencia disponible y las decisiones requeridas. Un sistema puede construirse a partir de representaciones CAD, observaciones simuladas RGB-D, imágenes de referencia de normalidad, defectos sintéticos, espacios de características preentrenados o indicaciones lingüísticas, y sin embargo desplegarse bajo diferentes sensores, iluminación, materiales, accesorios, calibración, variación de producción y modos de defecto raros. Esta revisión reencuadra la transferencia visual de simulación a realidad industrial como un problema de brecha de dominio organizado por la disponibilidad previa. Distinguimos configuraciones con CAD disponible, donde la geometría explícita del objeto puede respaldar la representación, calibración, estimación de pose, segmentación y verificación geométrica en tiempo de prueba; configuraciones sin CAD disponible, donde la geometría es reemplazada por apariencia de referencia de normalidad, distribuciones de características, residuales maestro-alumno, suposiciones de anomalías sintéticas, características fundamentales o priors de visión-lenguaje; y configuraciones con prior de contorno, donde modelos aproximados, plantillas, vistas de referencia o correspondencias semánticas preservan solo parte del rol del CAD. Este encuadre conecta la literatura de detección basada en CAD y estimación de pose 6D con la literatura de inspección de anomalías y superficies industriales que suele revisarse por separado. Para concretar la taxonomía, utilizamos anclajes empíricos en T-LESS/BOP, MVTec AD y VisA. Los anclajes muestran que la cantidad de representaciones CAD por sí sola no cierra la transferencia; el diseño de la distribución fuente, la capacidad del detector y una pequeña calibración real pueden ser más relevantes. También muestran que el CAD en tiempo de prueba crea un canal de verificación distinto mediante consistencia de máscara, pose y profundidad, mientras que la inspección sin CAD depende de una normalidad calibrada y la desviación de características. Por lo tanto, la revisión se opone a una única tabla de clasificación transversal entre tareas y, en su lugar, pregunta qué prior fundamenta la decisión de despliegue.
English
Industrial visual sim-to-real is often described as transferring from synthetic images to real images, but industrial deployment usually involves a broader mismatch between available evidence and required decisions. A system may be built from CAD renderings, simulated RGB-D observations, normal reference images, synthetic defects, pretrained feature spaces, or language prompts, yet deployed under different sensors, lighting, materials, fixtures, calibration, production variation, and rare defect modes. This review reframes industrial visual sim-to-real as a domain-gap problem organized by prior availability. We distinguish CAD-available settings, where explicit object geometry can support rendering, calibration, pose estimation, segmentation, and test-time geometric verification; CAD-unavailable settings, where geometry is replaced by normal-reference appearance, feature distributions, teacher-student residuals, synthetic anomaly assumptions, foundation features, or vision-language priors; and boundary-prior settings, where approximate models, templates, reference views, or semantic correspondences preserve only part of the CAD role. This framing connects CAD-based detection and 6D pose-estimation literature with industrial anomaly and surface-inspection literature that is usually reviewed separately. To make the taxonomy concrete, we use empirical anchors on T-LESS/BOP, MVTec AD, and VisA. The anchors show that CAD render count alone does not close transfer; source-distribution design, detector capacity, and small real calibration can matter more. They also show that CAD at test time creates a distinct verification channel through mask, pose, and depth consistency, whereas CAD-unavailable inspection relies on calibrated normality and feature deviation. The review therefore argues against a single cross-task leaderboard and instead asks what prior grounds the deployment decision.