ChatPaper.aiChatPaper

CARLA-Air: CARLA 세계 내 드론 비행 -- 공중-지상 구현형 인텔리전스를 위한 통합 인프라

CARLA-Air: Fly Drones Inside a CARLA World -- A Unified Infrastructure for Air-Ground Embodied Intelligence

March 30, 2026
저자: Tianle Zeng, Hanxuan Chen, Yanci Wen, Hong Zhang
cs.AI

초록

저고도 경제, 구현형 인텔리전스, 지상-공중 협력 시스템의 융합은 단일 물리적 일관성 환경 내에서 공중 및 지상 에이전트를 함께 모델링할 수 있는 시뮬레이션 인프라에 대한 수요를 증가시키고 있습니다. 기존 오픈소스 플랫폼은 여전히 영역이 분리되어 있습니다: 운전 시뮬레이터는 항공 역학을 지원하지 않고, 멀티로터 시뮬레이터는 현실적인 지상 장면을 제공하지 못합니다. 브리지 기반 연동 시뮬레이션은 동기화 오버헤드를 유발하며 엄격한 시공간 일관성을 보장할 수 없습니다. 본 논문은 단일 언리얼 엔진 프로세스 내에서 고품질 도시 주행 시뮬레이션과 물리 법칙을 정확히 따르는 멀티로터 비행 시뮬레이션을 통합한 오픈소스 인프라인 CARLA-Air를 제안합니다. 본 플랫폼은 CARLA와 AirSim의 기본 Python API 및 ROS 2 인터페이스를 모두 유지하여 코드 수정 없이 바로 재사용할 수 있습니다. 공유 물리 틱과 렌더링 파이프라인을 통해 CARLA-Air는 규정을 준수하는 교통 흐름, 사회적 인식을 반영한 보행자, 공기역학적으로 일관된 UAV 동역학을 갖춘 사실적인 환경을 제공하며, 각 틱마다 모든 플랫폼에서 최대 18가지 센서 모달리티의 데이터를 동기적으로 수집합니다. 본 플랫폼은 협업, 구현형 내비게이션 및 비전-언어 행동, 다중 모달 인식 및 데이터셋 구축, 강화 학습 기반 정책 훈련에 이르는 대표적인 지상-공중 구현형 인텔리전스 워크로드를 지원합니다. 확장 가능한 애셋 파이프라인을 통해 사용자 정의 로봇 플랫폼을 공유 세계에 통합할 수 있습니다. 상류 개발이 중단된 AirSim의 항공 기능을 계승함으로써, CARLA-Air는 이 널리 사용되는 비행 스택이 현대적인 인프라 내에서 지속적으로 발전할 수 있도록 보장합니다. 사전 빌드된 바이너리 및 전체 소스 코드와 함께 출시: https://github.com/louiszengCN/CarlaAir
English
The convergence of low-altitude economies, embodied intelligence, and air-ground cooperative systems creates growing demand for simulation infrastructure capable of jointly modeling aerial and ground agents within a single physically coherent environment. Existing open-source platforms remain domain-segregated: driving simulators lack aerial dynamics, while multirotor simulators lack realistic ground scenes. Bridge-based co-simulation introduces synchronization overhead and cannot guarantee strict spatial-temporal consistency. We present CARLA-Air, an open-source infrastructure that unifies high-fidelity urban driving and physics-accurate multirotor flight within a single Unreal Engine process. The platform preserves both CARLA and AirSim native Python APIs and ROS 2 interfaces, enabling zero-modification code reuse. Within a shared physics tick and rendering pipeline, CARLA-Air delivers photorealistic environments with rule-compliant traffic, socially-aware pedestrians, and aerodynamically consistent UAV dynamics, synchronously capturing up to 18 sensor modalities across all platforms at each tick. The platform supports representative air-ground embodied intelligence workloads spanning cooperation, embodied navigation and vision-language action, multi-modal perception and dataset construction, and reinforcement-learning-based policy training. An extensible asset pipeline allows integration of custom robot platforms into the shared world. By inheriting AirSim's aerial capabilities -- whose upstream development has been archived -- CARLA-Air ensures this widely adopted flight stack continues to evolve within a modern infrastructure. Released with prebuilt binaries and full source: https://github.com/louiszengCN/CarlaAir
PDF2282April 2, 2026