Taalgeconditioneerd Verkeersgeneratie
Language Conditioned Traffic Generation
July 16, 2023
Auteurs: Shuhan Tan, Boris Ivanovic, Xinshuo Weng, Marco Pavone, Philipp Kraehenbuehl
cs.AI
Samenvatting
Simulatie vormt de ruggengraat van moderne ontwikkeling van zelfrijdende voertuigen. Simulatoren helpen bij het ontwikkelen, testen en verbeteren van rijsystemen zonder mensen, voertuigen of hun omgeving in gevaar te brengen. Simulatoren staan echter voor een grote uitdaging: ze zijn afhankelijk van realistische, schaalbare en toch interessante inhoud. Hoewel recente vooruitgang in rendering en scène-reconstructie grote stappen zet in het creëren van statische scène-elementen, blijft het modelleren van hun indeling, dynamiek en gedrag een uitdaging. In dit werk richten we ons op taal als bron van supervisie voor het genereren van dynamische verkeersscènes. Ons model, LCTGen, combineert een groot taalmodel met een transformer-gebaseerde decoderarchitectuur die waarschijnlijke kaartlocaties selecteert uit een dataset van kaarten, en produceert een initiële verkeersverdeling, evenals de dynamiek van elk voertuig. LCTGen overtreft eerder werk op het gebied van zowel onvoorwaardelijke als voorwaardelijke verkeersscènegeneratie in termen van realisme en nauwkeurigheid. Code en video zullen beschikbaar zijn op https://ariostgx.github.io/lctgen.
English
Simulation forms the backbone of modern self-driving development. Simulators
help develop, test, and improve driving systems without putting humans,
vehicles, or their environment at risk. However, simulators face a major
challenge: They rely on realistic, scalable, yet interesting content. While
recent advances in rendering and scene reconstruction make great strides in
creating static scene assets, modeling their layout, dynamics, and behaviors
remains challenging. In this work, we turn to language as a source of
supervision for dynamic traffic scene generation. Our model, LCTGen, combines a
large language model with a transformer-based decoder architecture that selects
likely map locations from a dataset of maps, and produces an initial traffic
distribution, as well as the dynamics of each vehicle. LCTGen outperforms prior
work in both unconditional and conditional traffic scene generation in terms of
realism and fidelity. Code and video will be available at
https://ariostgx.github.io/lctgen.