産業用ビジュアルSim-to-Realにおける事前利用可能性:CADガイド型およびCAD非利用型のレビュー
Prior Availability in Industrial Visual Sim-to-Real: A Review of CAD-Guided and CAD-Unavailable Regimes
May 28, 2026
著者: Chenxi Tao, Seung-Kyum Choi
cs.AI
要旨
産業用ビジュアルsim-to-realは、しばしば合成画像から実画像への転送として説明されるが、産業展開では通常、利用可能な証拠と必要な判断の間により広範なミスマッチが伴う。システムは、CADレンダリング、シミュレーションRGB-D観測、正常参照画像、合成欠陥、事前学習済み特徴空間、または言語プロンプトから構築される可能性があるが、異なるセンサー、照明、素材、治具、キャリブレーション、製造バリエーション、および稀な欠陥モードの下で展開される。本レビューでは、産業用ビジュアルsim-to-realを、事前の利用可能性によって整理されたドメインギャップ問題として再構成する。我々は、明示的な物体形状がレンダリング、キャリブレーション、ポーズ推定、セグメンテーション、およびテスト時幾何検証をサポートできるCAD利用可能設定、形状が正常参照外観、特徴分布、教師-生徒残差、合成異常仮定、基盤特徴、または視覚言語事前知識に置き換えられるCAD非利用可能設定、ならびに近似モデル、テンプレート、参照ビュー、または意味対応がCADの役割の一部のみを保持する境界事前設定を区別する。この枠組みは、通常は別々にレビューされるCADベースの検出および6Dポーズ推定文献と、産業用異常および表面検査文献を結びつける。この分類法を具体化するために、T-LESS/BOP、MVTec AD、VisAに関する経験的アンカーを使用する。アンカーは、CADレンダリング数だけでは転送を完了せず、ソース分布設計、検出器容量、および少数の実キャリブレーションがより重要であることを示している。また、テスト時のCADは、マスク、ポーズ、深度の一貫性を通じて明確な検証チャネルを生成するのに対し、CAD非利用可能検査は、校正された正常性と特徴偏差に依存することを示している。したがって、本レビューは単一のクロスタスクリーダーボードに反対し、代わりに展開の決定を支える事前知識は何かを問う。
English
Industrial visual sim-to-real is often described as transferring from synthetic images to real images, but industrial deployment usually involves a broader mismatch between available evidence and required decisions. A system may be built from CAD renderings, simulated RGB-D observations, normal reference images, synthetic defects, pretrained feature spaces, or language prompts, yet deployed under different sensors, lighting, materials, fixtures, calibration, production variation, and rare defect modes. This review reframes industrial visual sim-to-real as a domain-gap problem organized by prior availability. We distinguish CAD-available settings, where explicit object geometry can support rendering, calibration, pose estimation, segmentation, and test-time geometric verification; CAD-unavailable settings, where geometry is replaced by normal-reference appearance, feature distributions, teacher-student residuals, synthetic anomaly assumptions, foundation features, or vision-language priors; and boundary-prior settings, where approximate models, templates, reference views, or semantic correspondences preserve only part of the CAD role. This framing connects CAD-based detection and 6D pose-estimation literature with industrial anomaly and surface-inspection literature that is usually reviewed separately. To make the taxonomy concrete, we use empirical anchors on T-LESS/BOP, MVTec AD, and VisA. The anchors show that CAD render count alone does not close transfer; source-distribution design, detector capacity, and small real calibration can matter more. They also show that CAD at test time creates a distinct verification channel through mask, pose, and depth consistency, whereas CAD-unavailable inspection relies on calibrated normality and feature deviation. The review therefore argues against a single cross-task leaderboard and instead asks what prior grounds the deployment decision.