GET-Zero: Transformador de Embodimento de Gráfico para Generalização de Embodimento sem Supervisão
GET-Zero: Graph Embodiment Transformer for Zero-shot Embodiment Generalization
July 20, 2024
Autores: Austin Patel, Shuran Song
cs.AI
Resumo
Este artigo apresenta o GET-Zero, uma arquitetura de modelo e procedimento de treinamento para aprender uma política de controle consciente da incorporação que pode se adaptar imediatamente a novas mudanças de hardware sem a necessidade de novo treinamento. Para isso, apresentamos o Transformador de Incorporação de Grafos (GET), um modelo transformer que alavanca a conectividade do grafo de incorporação como um viés estrutural aprendido no mecanismo de atenção. Utilizamos clonagem de comportamento para destilar dados de demonstração de políticas especializadas em incorporação em um modelo GET consciente da incorporação que se condiciona à configuração de hardware do robô para tomar decisões de controle. Realizamos um estudo de caso em uma tarefa de rotação de objetos em mãos habilidosas usando diferentes configurações de uma mão de robô de quatro dedos com articulações removidas e com extensões de comprimento de elo. Utilizando o modelo GET juntamente com uma perda de auto-modelagem, o GET-Zero generaliza para variações não vistas na estrutura do grafo e no comprimento do elo, resultando em uma melhoria de 20% em relação aos métodos de referência. Todo o código e resultados qualitativos em vídeo estão disponíveis em https://get-zero-paper.github.io
English
This paper introduces GET-Zero, a model architecture and training procedure
for learning an embodiment-aware control policy that can immediately adapt to
new hardware changes without retraining. To do so, we present Graph Embodiment
Transformer (GET), a transformer model that leverages the embodiment graph
connectivity as a learned structural bias in the attention mechanism. We use
behavior cloning to distill demonstration data from embodiment-specific expert
policies into an embodiment-aware GET model that conditions on the hardware
configuration of the robot to make control decisions. We conduct a case study
on a dexterous in-hand object rotation task using different configurations of a
four-fingered robot hand with joints removed and with link length extensions.
Using the GET model along with a self-modeling loss enables GET-Zero to
zero-shot generalize to unseen variation in graph structure and link length,
yielding a 20% improvement over baseline methods. All code and qualitative
video results are on https://get-zero-paper.github.io