ChangeFlow -- 원격 탐사에서 변화 탐지를 위한 잠재 정류 흐름
ChangeFlow -- Latent Rectified Flow for Change Detection in Remote Sensing
May 14, 2026
저자: Blaž Rolih, Matic Fučka, Filip Wolf, Luka Čehovin Zajc
cs.AI
초록
원격 탐사 변화 탐지(RSCD)는 동일한 지리적 영역의 두 이미지 간 변화를 위치화하는 것을 목표로 한다. 실제로 변화 마스크는 순수한 국소적 외관 차이보다는 영역 수준 주석 규칙을 따르는 경우가 많아, 문맥 의존적이며 때로는 모호하다. 대부분의 최신 방법은 픽셀 단위 판별 분류를 활용하는데, 이는 입력당 단일 예측을 생성하며 변화된 영역을 일관된 전체로 명시적으로 모델링하지 못한다. 자연스러운 대안은 생성적 정식화(generative formulation)로, 이는 가능한 마스크의 분포를 모델링하여 샘플링을 통해 모호성을 포착하고 전역적 일관성을 장려할 수 있다. 그러나 기존의 생성적 RSCD 접근법은 일반적으로 픽셀 공간 생성의 높은 계산 비용과 조건화 메커니즘의 복잡성으로 인해 강력한 판별 기준선에 뒤처진다. 기존 판별 및 생성 방법의 한계를 해결하기 위해, 우리는 변화 탐지를 교정 흐름(rectified flow)을 통해 잠재 공간에서 변화 마스크의 합성으로 재구성하는 생성적 프레임워크인 ChangeFlow를 제안한다. ChangeFlow는 구조화되었으면서도 가벼운 조건 신호에 의해 유도되며, 확률적 설계는 자연스럽게 샘플링 기반 예측 앙상블을 지원한다. 즉, 여러 예측된 변화 마스크를 집계하면 강건성이 향상되고, 샘플 일치도는 모호한 영역을 강조하는 실용적인 신뢰도 추정을 제공한다. 네 가지 벤치마크에서 ChangeFlow는 평균 F1 80.4%를 달성하여 이전 최고 방법 대비 평균 1.3포인트 개선되었으며, 최근 강력한 기준선과 비슷한 추론 속도를 유지한다. 프로젝트 페이지: https://blaz-r.github.io/changeflow_cd
English
Remote sensing change detection (RSCD) aims to localise changes between two images of the same geographic region. In practice, change masks often follow region-level annotation conventions rather than purely local appearance differences, making them context-dependent and occasionally ambiguous. Most state-of-the-art methods utilise per-pixel discriminative classification, which produces a single prediction per input and fails to explicitly model the changed region as a coherent whole. A natural alternative is generative formulation, which can model a distribution of plausible masks, enabling sampling to capture ambiguity and encourage global consistency. However, existing generative RSCD approaches typically lag behind strong discriminative baselines due to the high computational cost of pixel-space generation and the complexity of their conditioning mechanisms. To address the limitations of prior discriminative and generative methods, we propose ChangeFlow, a generative framework that reformulates change detection as the synthesis of a change mask in latent space via rectified flow. ChangeFlow is guided by a structured yet lightweight conditioning signal, and its stochastic design naturally supports sampling-based prediction ensembling. Namely, aggregating multiple predicted change masks improves robustness, while sample agreement provides a practical confidence estimation that highlights ambiguous regions. Across four benchmarks, ChangeFlow achieves an average F1 of 80.4\%, improving by 1.3 points on average over the previous best method, while maintaining inference speed comparable to recent strong baselines. Project page: https://blaz-r.github.io/changeflow_cd