GET-Zero: Transformador de Embodiment de Grafos para Generalización de Embodiment sin Ejemplos.
GET-Zero: Graph Embodiment Transformer for Zero-shot Embodiment Generalization
July 20, 2024
Autores: Austin Patel, Shuran Song
cs.AI
Resumen
Este artículo presenta GET-Zero, una arquitectura de modelo y procedimiento de entrenamiento para aprender una política de control consciente de la incorporación que puede adaptarse inmediatamente a cambios de hardware sin necesidad de volver a entrenar. Para lograrlo, presentamos el Transformador de Incorporación de Grafos (GET), un modelo transformer que aprovecha la conectividad del grafo de incorporación como un sesgo estructural aprendido en el mecanismo de atención. Utilizamos clonación de comportamiento para destilar datos de demostración de políticas expertas específicas de la incorporación en un modelo GET consciente de la incorporación que se condiciona a la configuración de hardware del robot para tomar decisiones de control. Realizamos un estudio de caso en una tarea de rotación de objetos hábilmente en la mano utilizando diferentes configuraciones de una mano robótica de cuatro dedos con articulaciones eliminadas y extensiones de longitud de enlace. El uso del modelo GET junto con una pérdida de auto-modelado permite a GET-Zero generalizar de forma directa a variaciones no vistas en la estructura del grafo y la longitud del enlace, lo que resulta en una mejora del 20% sobre los métodos base. Todo el código y los resultados cualitativos en video se encuentran en https://get-zero-paper.github.io
English
This paper introduces GET-Zero, a model architecture and training procedure
for learning an embodiment-aware control policy that can immediately adapt to
new hardware changes without retraining. To do so, we present Graph Embodiment
Transformer (GET), a transformer model that leverages the embodiment graph
connectivity as a learned structural bias in the attention mechanism. We use
behavior cloning to distill demonstration data from embodiment-specific expert
policies into an embodiment-aware GET model that conditions on the hardware
configuration of the robot to make control decisions. We conduct a case study
on a dexterous in-hand object rotation task using different configurations of a
four-fingered robot hand with joints removed and with link length extensions.
Using the GET model along with a self-modeling loss enables GET-Zero to
zero-shot generalize to unseen variation in graph structure and link length,
yielding a 20% improvement over baseline methods. All code and qualitative
video results are on https://get-zero-paper.github.ioSummary
AI-Generated Summary