ChatPaper.aiChatPaper

ChangeFlow — リモートセンシングにおける変化検出のための潜在補正流

ChangeFlow -- Latent Rectified Flow for Change Detection in Remote Sensing

May 14, 2026
著者: Blaž Rolih, Matic Fučka, Filip Wolf, Luka Čehovin Zajc
cs.AI

要旨

リモートセンシング変化検出(RSCD)は、同一地理領域を撮影した2枚の画像間の変化を特定することを目的とする。実際には、変化マスクは純粋な局所的な外観の差異よりも、領域レベルのアノテーション規則に従うことが多く、そのため文脈依存的であり、時に曖昧となる。最先端の手法のほとんどはピクセル単位の識別的分類を利用しており、入力ごとに単一の予測を生成するため、変化領域を一貫した全体として明示的にモデル化できない。これに対する自然な代替案として生成的定式化があり、これは妥当なマスクの分布をモデル化し、サンプリングによって曖昧さを捉え、全体的な一貫性を促進することを可能にする。しかしながら、既存の生成的RSCDアプローチは、ピクセル空間での生成に伴う高い計算コストと、その条件付け機構の複雑さのため、強力な識別的ベースラインに後れを取る傾向がある。従来の識別的手法および生成的手法の限界に対処するため、我々はChangeFlowを提案する。これは、整流フローを介して潜在空間における変化マスクの合成として変化検出を再定式化する生成的フレームワークである。ChangeFlowは、構造化されつつも軽量な条件付け信号によって導かれ、その確率的設計はサンプリングに基づく予測アンサンブルを自然にサポートする。すなわち、複数の予測変化マスクを集約することでロバスト性が向上し、サンプルの一致度は曖昧な領域を強調する実用的な信頼度推定を提供する。4つのベンチマークにおいて、ChangeFlowは平均F1スコア80.4%を達成し、従来の最良手法を平均1.3ポイント上回りながら、近年の強力なベースラインと同等の推論速度を維持している。プロジェクトページ: https://blaz-r.github.io/changeflow_cd
English
Remote sensing change detection (RSCD) aims to localise changes between two images of the same geographic region. In practice, change masks often follow region-level annotation conventions rather than purely local appearance differences, making them context-dependent and occasionally ambiguous. Most state-of-the-art methods utilise per-pixel discriminative classification, which produces a single prediction per input and fails to explicitly model the changed region as a coherent whole. A natural alternative is generative formulation, which can model a distribution of plausible masks, enabling sampling to capture ambiguity and encourage global consistency. However, existing generative RSCD approaches typically lag behind strong discriminative baselines due to the high computational cost of pixel-space generation and the complexity of their conditioning mechanisms. To address the limitations of prior discriminative and generative methods, we propose ChangeFlow, a generative framework that reformulates change detection as the synthesis of a change mask in latent space via rectified flow. ChangeFlow is guided by a structured yet lightweight conditioning signal, and its stochastic design naturally supports sampling-based prediction ensembling. Namely, aggregating multiple predicted change masks improves robustness, while sample agreement provides a practical confidence estimation that highlights ambiguous regions. Across four benchmarks, ChangeFlow achieves an average F1 of 80.4\%, improving by 1.3 points on average over the previous best method, while maintaining inference speed comparable to recent strong baselines. Project page: https://blaz-r.github.io/changeflow_cd