ChatPaper.aiChatPaper

CARLA-Air:CARLAワールド内でのドローン飛行――空中・地上統合エンボディードAIのための統一インフラストラクチャ

CARLA-Air: Fly Drones Inside a CARLA World -- A Unified Infrastructure for Air-Ground Embodied Intelligence

March 30, 2026
著者: Tianle Zeng, Hanxuan Chen, Yanci Wen, Hong Zhang
cs.AI

要旨

低高度経済、エンボディード知能、および空地協調システムの収束により、単一の物理的に一貫した環境内で航空エージェントと地上エージェントを統合的にモデリング可能なシミュレーション基盤への需要が高まっています。既存のオープンソースプラットフォームは分野別に分断されたままです:運転シミュレータは航空力学を欠き、マルチローターシミュレータは現実的な地上シーンを備えていません。ブリッジベースの共シミュレーションは同期オーバーヘッドを生じ、厳密な時空間一貫性を保証できません。 本論文ではCARLA-Airを提案します。これは単一のUnreal Engineプロセス内で高精細な都市運転シミュレーションと物理精度の高いマルチローター飛行シミュレーションを統合するオープンソース基盤です。本プラットフォームはCARLAとAirSimのネイティブPython APIおよびROS 2インターフェースを維持し、コード修正なしでの再利用を可能にします。共有物理ティックとレンダリングパイプライン内で、CARLA-Airは写実的な環境、規則準拠の交通、社会的意識を持つ歩行者、空力学的に一貫したUAVダイナミクスを提供し、各ティックで全プラットフォームにわたる最大18種類のセンサーモダリティを同期取得します。本プラットフォームは、協調動作、エンボディードナビゲーションと視覚言語行動、マルチモーダル知覚とデータセット構築、強化学習ベースのポリシー訓練に至るまで、代表的な空地エンボディード知能ワークロードをサポートします。拡張可能なアセットパイプラインにより、カスタムロボットプラットフォームの共有世界への統合が可能です。上流開発がアーカイブ化されたAirSimの航空機能を継承することで、CARLA-Airはこの広く採用されている飛行スタックが現代的な基盤内で進化し続けることを保証します。 ビルド済みバイナリと完全なソースコードを公開:https://github.com/louiszengCN/CarlaAir
English
The convergence of low-altitude economies, embodied intelligence, and air-ground cooperative systems creates growing demand for simulation infrastructure capable of jointly modeling aerial and ground agents within a single physically coherent environment. Existing open-source platforms remain domain-segregated: driving simulators lack aerial dynamics, while multirotor simulators lack realistic ground scenes. Bridge-based co-simulation introduces synchronization overhead and cannot guarantee strict spatial-temporal consistency. We present CARLA-Air, an open-source infrastructure that unifies high-fidelity urban driving and physics-accurate multirotor flight within a single Unreal Engine process. The platform preserves both CARLA and AirSim native Python APIs and ROS 2 interfaces, enabling zero-modification code reuse. Within a shared physics tick and rendering pipeline, CARLA-Air delivers photorealistic environments with rule-compliant traffic, socially-aware pedestrians, and aerodynamically consistent UAV dynamics, synchronously capturing up to 18 sensor modalities across all platforms at each tick. The platform supports representative air-ground embodied intelligence workloads spanning cooperation, embodied navigation and vision-language action, multi-modal perception and dataset construction, and reinforcement-learning-based policy training. An extensible asset pipeline allows integration of custom robot platforms into the shared world. By inheriting AirSim's aerial capabilities -- whose upstream development has been archived -- CARLA-Air ensures this widely adopted flight stack continues to evolve within a modern infrastructure. Released with prebuilt binaries and full source: https://github.com/louiszengCN/CarlaAir
PDF2282April 2, 2026