Modelos de Fundación Espacio-Temporales Urbanos para Viviendas Resilientes al Clima: Escalando Transformadores de Difusión para la Predicción del Riesgo de Desastres
Urban Spatio-Temporal Foundation Models for Climate-Resilient Housing: Scaling Diffusion Transformers for Disaster Risk Prediction
February 5, 2026
Autores: Olaf Yunus Laitinen Imanov, Derya Umut Kulali, Taner Yilmaz
cs.AI
Resumen
Los peligros climáticos interrumpen cada vez más las operaciones de transporte urbano y de respuesta a emergencias al dañar el parque de viviendas, degradar la infraestructura y reducir la accesibilidad de la red. Este artículo presenta Skjold-DiT, un marco de difusión-transformador que integra datos urbanos espacio-temporales heterogéneos para pronosticar indicadores de riesgo climático a nivel de edificio, incorporando explícitamente la estructura de la red de transporte y señales de accesibilidad relevantes para vehículos inteligentes (por ejemplo, alcanzabilidad de emergencia y restricciones de rutas de evacuación). Concretamente, Skjold-DiT permite restricciones de enrutamiento condicionadas por peligros al producir capas de accesibilidad calibradas y conscientes de la incertidumbre (alcanzabilidad, inflación del tiempo de viaje y redundancia de rutas) que pueden ser utilizadas por sistemas de enrutamiento de vehículos inteligentes y despacho de emergencias. Skjold-DiT combina: (1) Fjell-Prompt, una interfaz de condicionamiento basada en *prompts* diseñada para soportar transferencia entre ciudades; (2) Norrland-Fusion, un mecanismo de atención cross-modal que unifica mapas/imágenes de peligros, atributos de edificios, datos demográficos e infraestructura de transporte en una representación latente compartida; y (3) Valkyrie-Forecast, un simulador contrafactual para generar trayectorias de riesgo probabilísticas bajo *prompts* de intervención. Presentamos el conjunto de datos Baltic-Caspian Urban Resilience (BCUR) con 847.392 observaciones a nivel de edificio en seis ciudades, que incluye anotaciones de múltiples peligros (por ejemplo, indicadores de inundación y calor) y características de accesibilidad del transporte. Los experimentos evalúan la calidad de la predicción, la generalización entre ciudades, la calibración y los resultados relevantes para el transporte, incluyendo la alcanzabilidad y los tiempos de viaje condicionados por peligros bajo intervenciones contrafactuales.
English
Climate hazards increasingly disrupt urban transportation and emergency-response operations by damaging housing stock, degrading infrastructure, and reducing network accessibility. This paper presents Skjold-DiT, a diffusion-transformer framework that integrates heterogeneous spatio-temporal urban data to forecast building-level climate-risk indicators while explicitly incorporating transportation-network structure and accessibility signals relevant to intelligent vehicles (e.g., emergency reachability and evacuation-route constraints). Concretely, Skjold-DiT enables hazard-conditioned routing constraints by producing calibrated, uncertainty-aware accessibility layers (reachability, travel-time inflation, and route redundancy) that can be consumed by intelligent-vehicle routing and emergency dispatch systems. Skjold-DiT combines: (1) Fjell-Prompt, a prompt-based conditioning interface designed to support cross-city transfer; (2) Norrland-Fusion, a cross-modal attention mechanism unifying hazard maps/imagery, building attributes, demographics, and transportation infrastructure into a shared latent representation; and (3) Valkyrie-Forecast, a counterfactual simulator for generating probabilistic risk trajectories under intervention prompts. We introduce the Baltic-Caspian Urban Resilience (BCUR) dataset with 847,392 building-level observations across six cities, including multi-hazard annotations (e.g., flood and heat indicators) and transportation accessibility features. Experiments evaluate prediction quality, cross-city generalization, calibration, and downstream transportation-relevant outcomes, including reachability and hazard-conditioned travel times under counterfactual interventions.