RemoteVAR: Modellazione Visiva Autoregressiva per il Rilevamento dei Cambiamenti nel Telerilevamento
RemoteVAR: Autoregressive Visual Modeling for Remote Sensing Change Detection
January 17, 2026
Autori: Yilmaz Korkmaz, Vishal M. Patel
cs.AI
Abstract
La rilevazione dei cambiamenti mediante telerilevamento mira a localizzare e caratterizzare le variazioni di scena tra due istanti temporali ed è fondamentale per applicazioni come il monitoraggio ambientale e la valutazione dei disastri. Nel frattempo, i modelli autoregressivi visivi (VAR) hanno recentemente dimostrato capacità impressionanti nella generazione di immagini, ma il loro utilizzo per compiti discriminativi a livello di pixel rimane limitato a causa di una scarsa controllabilità, prestazioni subottimali nella predizione densa e bias di esposizione. Introduciamo RemoteVAR, un nuovo framework per la rilevazione dei cambiamenti basato su VAR che affronta queste limitazioni condizionando la predizione autoregressiva su caratteristiche bi-temporali fuse a multi-risoluzione tramite cross-attention e impiegando una strategia di addestramento autoregressivo progettata specificamente per la predizione di mappe di cambiamento. Esperimenti estesi su benchmark standard di change detection mostrano che RemoteVAR fornisce miglioramenti consistenti e significativi rispetto a solide baseline basate su modelli diffusion e transformer, stabilendo un'alternativa autoregressiva competitiva per la rilevazione dei cambiamenti nel telerilevamento. Il codice sarà disponibile qui: https://github.com/yilmazkorkmaz1/RemoteVAR.
English
Remote sensing change detection aims to localize and characterize scene changes between two time points and is central to applications such as environmental monitoring and disaster assessment. Meanwhile, visual autoregressive models (VARs) have recently shown impressive image generation capability, but their adoption for pixel-level discriminative tasks remains limited due to weak controllability, suboptimal dense prediction performance and exposure bias. We introduce RemoteVAR, a new VAR-based change detection framework that addresses these limitations by conditioning autoregressive prediction on multi-resolution fused bi-temporal features via cross-attention, and by employing an autoregressive training strategy designed specifically for change map prediction. Extensive experiments on standard change detection benchmarks show that RemoteVAR delivers consistent and significant improvements over strong diffusion-based and transformer-based baselines, establishing a competitive autoregressive alternative for remote sensing change detection. Code will be available https://github.com/yilmazkorkmaz1/RemoteVAR{here}.