ChatPaper.aiChatPaper

ChangeFlow – Latent Rectified Flow für die Veränderungserkennung in der Fernerkundung

ChangeFlow -- Latent Rectified Flow for Change Detection in Remote Sensing

May 14, 2026
Autoren: Blaž Rolih, Matic Fučka, Filip Wolf, Luka Čehovin Zajc
cs.AI

Zusammenfassung

Die Fernerkundungs-Änderungserkennung (RSCD) zielt darauf ab, Veränderungen zwischen zwei Bildern derselben geografischen Region zu lokalisieren. In der Praxis folgen Änderungsmasken oft regionsbezogenen Annotationskonventionen und nicht rein lokalen Erscheinungsunterschieden, was sie kontextabhängig und gelegentlich mehrdeutig macht. Die meisten modernen Methoden verwenden eine pixelweise diskriminative Klassifikation, die eine einzelne Vorhersage pro Eingabe erzeugt und es versäumt, die veränderte Region explizit als kohärentes Ganzes zu modellieren. Eine natürliche Alternative ist die generative Formulierung, die eine Verteilung plausibler Masken modellieren kann, wodurch Sampling die Mehrdeutigkeit erfassen und globale Konsistenz fördern kann. Allerdings bleiben bestehende generative RSCD-Ansätze aufgrund der hohen Rechenkosten der Pixelerzeugung und der Komplexität ihrer Konditionierungsmechanismen typischerweise hinter starken diskriminativen Basislinien zurück. Um die Einschränkungen früherer diskriminativer und generativer Methoden zu adressieren, schlagen wir ChangeFlow vor, ein generatives Framework, das die Änderungserkennung als Synthese einer Änderungsmaske im latenten Raum mittels Rectified Flow umformuliert. ChangeFlow wird durch ein strukturiertes und dennoch leichtgewichtiges Konditionierungssignal gesteuert, und sein stochastisches Design unterstützt auf natürliche Weise ein sampling-basiertes Vorhersage-Ensembling. Insbesondere verbessert die Aggregation mehrerer vorhergesagter Änderungsmasken die Robustheit, während die Übereinstimmung der Stichproben eine praktische Konfidenzschätzung liefert, die mehrdeutige Regionen hervorhebt. Über vier Benchmarks hinweg erreicht ChangeFlow einen durchschnittlichen F1-Score von 80,4%, was einer durchschnittlichen Verbesserung von 1,3 Punkten gegenüber der bisher besten Methode entspricht, während die Inferenzgeschwindigkeit mit aktuellen starken Basislinien vergleichbar bleibt. Projektseite: https://blaz-r.github.io/changeflow_cd
English
Remote sensing change detection (RSCD) aims to localise changes between two images of the same geographic region. In practice, change masks often follow region-level annotation conventions rather than purely local appearance differences, making them context-dependent and occasionally ambiguous. Most state-of-the-art methods utilise per-pixel discriminative classification, which produces a single prediction per input and fails to explicitly model the changed region as a coherent whole. A natural alternative is generative formulation, which can model a distribution of plausible masks, enabling sampling to capture ambiguity and encourage global consistency. However, existing generative RSCD approaches typically lag behind strong discriminative baselines due to the high computational cost of pixel-space generation and the complexity of their conditioning mechanisms. To address the limitations of prior discriminative and generative methods, we propose ChangeFlow, a generative framework that reformulates change detection as the synthesis of a change mask in latent space via rectified flow. ChangeFlow is guided by a structured yet lightweight conditioning signal, and its stochastic design naturally supports sampling-based prediction ensembling. Namely, aggregating multiple predicted change masks improves robustness, while sample agreement provides a practical confidence estimation that highlights ambiguous regions. Across four benchmarks, ChangeFlow achieves an average F1 of 80.4\%, improving by 1.3 points on average over the previous best method, while maintaining inference speed comparable to recent strong baselines. Project page: https://blaz-r.github.io/changeflow_cd