SafeDiffuser: Planificación Segura con Modelos Probabilísticos de Difusión
SafeDiffuser: Safe Planning with Diffusion Probabilistic Models
May 31, 2023
Autores: Wei Xiao, Tsun-Hsuan Wang, Chuang Gan, Daniela Rus
cs.AI
Resumen
Los enfoques basados en modelos de difusión han mostrado potencial en la planificación basada en datos, pero carecen de garantías de seguridad, lo que dificulta su aplicación en tareas críticas. Para abordar estos desafíos, proponemos un nuevo método, llamado SafeDiffuser, que asegura que los modelos probabilísticos de difusión cumplan con especificaciones mediante el uso de una clase de funciones de barrera de control. La idea clave de nuestro enfoque es incorporar la invariancia de difusión en tiempo finito propuesta en el proceso de eliminación de ruido de la difusión, lo que permite la generación confiable de datos mediante difusión. Además, demostramos que nuestro método de invariancia de difusión en tiempo finito a través de modelos generativos no solo mantiene el rendimiento de generalización, sino que también aporta robustez en la generación segura de datos. Probamos nuestro método en una serie de tareas de planificación segura, incluyendo la generación de rutas en laberintos, la locomoción de robots con patas y la manipulación en espacios 3D, mostrando los resultados ventajas en robustez y garantías sobre los modelos de difusión convencionales.
English
Diffusion model-based approaches have shown promise in data-driven planning,
but there are no safety guarantees, thus making it hard to be applied for
safety-critical applications. To address these challenges, we propose a new
method, called SafeDiffuser, to ensure diffusion probabilistic models satisfy
specifications by using a class of control barrier functions. The key idea of
our approach is to embed the proposed finite-time diffusion invariance into the
denoising diffusion procedure, which enables trustworthy diffusion data
generation. Moreover, we demonstrate that our finite-time diffusion invariance
method through generative models not only maintains generalization performance
but also creates robustness in safe data generation. We test our method on a
series of safe planning tasks, including maze path generation, legged robot
locomotion, and 3D space manipulation, with results showing the advantages of
robustness and guarantees over vanilla diffusion models.