ChatPaper.aiChatPaper

Generazione del Traffico Condizionata dal Linguaggio

Language Conditioned Traffic Generation

July 16, 2023
Autori: Shuhan Tan, Boris Ivanovic, Xinshuo Weng, Marco Pavone, Philipp Kraehenbuehl
cs.AI

Abstract

La simulazione costituisce il fondamento dello sviluppo moderno dei veicoli autonomi. I simulatori aiutano a sviluppare, testare e migliorare i sistemi di guida senza mettere a rischio esseri umani, veicoli o il loro ambiente. Tuttavia, i simulatori affrontano una sfida significativa: dipendono da contenuti realistici, scalabili e al tempo stesso interessanti. Sebbene i recenti progressi nel rendering e nella ricostruzione delle scene abbiano compiuto grandi passi avanti nella creazione di asset di scene statiche, modellarne la disposizione, le dinamiche e i comportamenti rimane una sfida. In questo lavoro, ci rivolgiamo al linguaggio come fonte di supervisione per la generazione di scene di traffico dinamiche. Il nostro modello, LCTGen, combina un modello linguistico di grandi dimensioni con un'architettura decoder basata su transformer che seleziona posizioni probabili su una mappa da un dataset di mappe e produce una distribuzione iniziale del traffico, nonché le dinamiche di ciascun veicolo. LCTGen supera i lavori precedenti sia nella generazione incondizionata che condizionata di scene di traffico in termini di realismo e fedeltà. Codice e video saranno disponibili su https://ariostgx.github.io/lctgen.
English
Simulation forms the backbone of modern self-driving development. Simulators help develop, test, and improve driving systems without putting humans, vehicles, or their environment at risk. However, simulators face a major challenge: They rely on realistic, scalable, yet interesting content. While recent advances in rendering and scene reconstruction make great strides in creating static scene assets, modeling their layout, dynamics, and behaviors remains challenging. In this work, we turn to language as a source of supervision for dynamic traffic scene generation. Our model, LCTGen, combines a large language model with a transformer-based decoder architecture that selects likely map locations from a dataset of maps, and produces an initial traffic distribution, as well as the dynamics of each vehicle. LCTGen outperforms prior work in both unconditional and conditional traffic scene generation in terms of realism and fidelity. Code and video will be available at https://ariostgx.github.io/lctgen.
PDF50December 15, 2024