Guidare Ovunque con l'Adattamento delle Politiche dei Modelli Linguistici di Grande Scala
Driving Everywhere with Large Language Model Policy Adaptation
February 8, 2024
Autori: Boyi Li, Yue Wang, Jiageng Mao, Boris Ivanovic, Sushant Veer, Karen Leung, Marco Pavone
cs.AI
Abstract
Adattare il comportamento di guida a nuovi ambienti, usanze e leggi è un problema di lunga data nella guida autonoma, che impedisce la diffusione su larga scala dei veicoli autonomi (AV). In questo articolo, presentiamo LLaDA, uno strumento semplice ma potente che consente sia ai conducenti umani che ai veicoli autonomi di guidare ovunque, adattando i loro compiti e piani di movimento alle regole del traffico in nuove località. LLaDA raggiunge questo obiettivo sfruttando l'impressionante capacità di generalizzazione zero-shot dei modelli linguistici di grandi dimensioni (LLM) nell'interpretare le regole del traffico presenti nel manuale del conducente locale. Attraverso un ampio studio sugli utenti, dimostriamo che le istruzioni di LLaDA sono utili per chiarire situazioni impreviste in contesti reali. Mostriamo inoltre la capacità di LLaDA di adattare le politiche di pianificazione del movimento degli AV in dataset del mondo reale; LLaDA supera gli approcci di pianificazione di base in tutte le nostre metriche. Per maggiori dettagli, consultate il nostro sito web: https://boyiliee.github.io/llada.
English
Adapting driving behavior to new environments, customs, and laws is a
long-standing problem in autonomous driving, precluding the widespread
deployment of autonomous vehicles (AVs). In this paper, we present LLaDA, a
simple yet powerful tool that enables human drivers and autonomous vehicles
alike to drive everywhere by adapting their tasks and motion plans to traffic
rules in new locations. LLaDA achieves this by leveraging the impressive
zero-shot generalizability of large language models (LLMs) in interpreting the
traffic rules in the local driver handbook. Through an extensive user study, we
show that LLaDA's instructions are useful in disambiguating in-the-wild
unexpected situations. We also demonstrate LLaDA's ability to adapt AV motion
planning policies in real-world datasets; LLaDA outperforms baseline planning
approaches on all our metrics. Please check our website for more details:
https://boyiliee.github.io/llada.