SENSE:持続可能な環境のための衛星ベースのエネルギー合成
SENSE: Satellite-based ENergy Synthesis for Sustainable Environment
May 18, 2026
著者: Kailai Sun, Mingyi He, Heye Huang, Can Rong, Alok Prakash, Baoshen Guo, Shenhao Wang, Jinhua Zhao
cs.AI
要旨
都市建物エネルギーモデリング(UBEM)は、国連の持続可能な開発目標(SDGs)第7目標および第11目標の達成において極めて重要な役割を果たす。衛星画像と深層学習に基づく既存研究は顕著な進展を遂げているものの、多くの課題が存在する。すなわち、既存研究の大半は本質的に予測型であり、都市計画の生成的な性質を反映できていないこと、生成AIや拡散モデルが衛星画像分野で爆発的な発展を遂げている一方で、都市の機能生成(例えばエネルギー層)が欠けていること、さらに、高品質かつ高解像度の建物エネルギー消費データと衛星画像を整列させたデータが限られており希少であることである。本稿では、SENSE(Satellite-based ENergy Synthesis for Sustainable Environment:持続可能な環境のための衛星ベースエネルギー合成)を提案する。SENSEは、現実的な都市衛星画像と、それに整列された高品質の建物エネルギー消費量および高さマップを統合的に生成する統一的な生成型UBEMフレームワークである。道路網と都市密度指標を条件として、制御可能な拡散モデルに基づくSENSEは、大規模視覚モデルが学習した知識を活用し、潜在空間において都市の建物エネルギー消費量と高さ情報(アノテーション)を生成する。ニューヨーク市、ボストン、リヨン、釜山の4都市で実施した実験により、SENSEは高い視覚的忠実度と強力な物理的一貫性を達成し、ASHRAE標準指標を満たすことが示された。実験では、SENSEはラベル付きエネルギーデータの20%未満を用いて、十分な合成アノテーションデータを生成でき、下流の予測性能をIoUで10%向上させた。最先端の都市エネルギー予測手法と比較して、SENSEは予測誤差を大幅に低減した(NMBEで3~11%、CVRMSEで1~9%の低減)。本研究は、都市科学、エネルギー科学、建築科学に対し、エネルギー効率の高い都市計画と物理的生成のソリューションを提供する。データセットとコードは以下から入手可能:https://huggingface.co/datasets/skl24/MUSE および https://github.com/kailaisun/GenAI4Urban-Energy/。
English
Urban Building Energy Modeling plays a critical role in achieving the United Nations' Sustainable Development Goals 7 and 11. Although existing studies based on satellite imagery and deep learning have achieved remarkable progress, many challenges exist: most existing studies are inherently predictive, failing to reflect the generative nature of urban planning; although generative AI and diffusion models have seen explosive growth in satellite imagery, they lack the urban functional generation (e.g., energy layer); third, aligned high-quality high-resolution building energy data with satellite imagery is limited and scarce. Here we propose SENSE (Satellite-based ENergy Synthesis for Sustainable Environment), a unified generative UBEM framework that jointly synthesizes realistic urban satellite imagery and aligned high-quality building energy consumption and height maps. By conditioning on road networks and urban density metrics, SENSE, based on a controllable diffusion model, leverages the knowledge learned by large vision models to generate urban building energy consumption and height information (annotations) in the latent space. Experiments across four cities (New York City, Boston, Lyon, Busan) demonstrate that SENSE achieves high visual fidelity and strong physical consistency, satisfying the ASHRAE standard metric. Experiments demonstrate that SENSE can generate enough annotated synthetic data using less than 20% labeled energy data, boosting downstream prediction performance by 10% IoU. Compared to SOTA urban energy prediction methods, SENSE significantly reduced prediction error (reduced 3%-11% NMBE and 1%-9% CVRMSE). This study offers an energy-efficiency urban planning and physical generation solution for urban science, energy science and building science. The dataset and code: https://huggingface.co/datasets/skl24/MUSE and https://github.com/kailaisun/GenAI4Urban-Energy/.