Conduire partout avec l'adaptation de politiques basée sur les grands modèles de langage
Driving Everywhere with Large Language Model Policy Adaptation
February 8, 2024
Auteurs: Boyi Li, Yue Wang, Jiageng Mao, Boris Ivanovic, Sushant Veer, Karen Leung, Marco Pavone
cs.AI
Résumé
Adapter le comportement de conduite à de nouveaux environnements, coutumes et lois constitue un problème de longue date dans la conduite autonome, empêchant le déploiement généralisé des véhicules autonomes (VA). Dans cet article, nous présentons LLaDA, un outil simple mais puissant qui permet aux conducteurs humains et aux véhicules autonomes de conduire partout en adaptant leurs tâches et plans de mouvement aux règles de circulation des nouveaux lieux. LLaDA y parvient en exploitant l'impressionnante généralisation en zero-shot des modèles de langage de grande taille (LLMs) pour interpréter les règles de circulation du manuel du conducteur local. À travers une étude utilisateur approfondie, nous montrons que les instructions de LLaDA sont utiles pour lever les ambiguïtés dans des situations inattendues sur le terrain. Nous démontrons également la capacité de LLaDA à adapter les politiques de planification de mouvement des VA sur des jeux de données réels ; LLaDA surpasse les approches de planification de référence sur tous nos critères. Pour plus de détails, consultez notre site web : https://boyiliee.github.io/llada.
English
Adapting driving behavior to new environments, customs, and laws is a
long-standing problem in autonomous driving, precluding the widespread
deployment of autonomous vehicles (AVs). In this paper, we present LLaDA, a
simple yet powerful tool that enables human drivers and autonomous vehicles
alike to drive everywhere by adapting their tasks and motion plans to traffic
rules in new locations. LLaDA achieves this by leveraging the impressive
zero-shot generalizability of large language models (LLMs) in interpreting the
traffic rules in the local driver handbook. Through an extensive user study, we
show that LLaDA's instructions are useful in disambiguating in-the-wild
unexpected situations. We also demonstrate LLaDA's ability to adapt AV motion
planning policies in real-world datasets; LLaDA outperforms baseline planning
approaches on all our metrics. Please check our website for more details:
https://boyiliee.github.io/llada.