RemoteVAR : Modélisation visuelle autorégressive pour la détection de changements en télédétection
RemoteVAR: Autoregressive Visual Modeling for Remote Sensing Change Detection
January 17, 2026
papers.authors: Yilmaz Korkmaz, Vishal M. Patel
cs.AI
papers.abstract
La détection de changements par télédétection vise à localiser et caractériser les modifications de scène entre deux instants, et est essentielle pour des applications telles que la surveillance environnementale et l'évaluation des catastrophes. Parallèlement, les modèles visuels autorégressifs (VAR) ont récemment démontré des capacités impressionnantes en génération d'images, mais leur adoption pour les tâches discriminatives au niveau pixel reste limitée en raison d'une faible contrôlabilité, de performances sous-optimales en prédiction dense et d'un biais d'exposition. Nous présentons RemoteVAR, un nouveau cadre de détection de changements basé sur les VAR qui résout ces limitations en conditionnant la prédiction autorégressive sur des caractéristiques bi-temporelles fusionnées multi-résolution via une attention croisée, et en employant une stratégie d'entraînement autorégressif conçue spécifiquement pour la prédiction de cartes de changements. Des expériences approfondies sur des benchmarks standards de détection de changements montrent que RemoteVAR apporte des améliorations constantes et significatives par rapport à des modèles de référence solides basés sur les diffusion et les transformers, établissant ainsi une alternative autorégressive compétitive pour la détection de changements en télédétection. Le code sera disponible à l'adresse https://github.com/yilmazkorkmaz1/RemoteVAR.
English
Remote sensing change detection aims to localize and characterize scene changes between two time points and is central to applications such as environmental monitoring and disaster assessment. Meanwhile, visual autoregressive models (VARs) have recently shown impressive image generation capability, but their adoption for pixel-level discriminative tasks remains limited due to weak controllability, suboptimal dense prediction performance and exposure bias. We introduce RemoteVAR, a new VAR-based change detection framework that addresses these limitations by conditioning autoregressive prediction on multi-resolution fused bi-temporal features via cross-attention, and by employing an autoregressive training strategy designed specifically for change map prediction. Extensive experiments on standard change detection benchmarks show that RemoteVAR delivers consistent and significant improvements over strong diffusion-based and transformer-based baselines, establishing a competitive autoregressive alternative for remote sensing change detection. Code will be available https://github.com/yilmazkorkmaz1/RemoteVAR{here}.