Transformeurs d'Algèbre Géométrique
Geometric Algebra Transformers
May 28, 2023
Auteurs: Johann Brehmer, Pim de Haan, Sönke Behrends, Taco Cohen
cs.AI
Résumé
Les problèmes impliquant des données géométriques apparaissent dans divers domaines, notamment la vision par ordinateur, la robotique, la chimie et la physique. Ces données peuvent prendre de nombreuses formes, telles que des points, des vecteurs directionnels, des plans ou des transformations, mais à ce jour, il n'existe pas d'architecture unique pouvant être appliquée à une telle variété de types géométriques tout en respectant leurs symétries. Dans cet article, nous présentons le Geometric Algebra Transformer (GATr), une architecture polyvalente pour les données géométriques. GATr représente les entrées, les sorties et les états cachés dans l'algèbre géométrique projective, qui offre une représentation efficace en espace vectoriel à 16 dimensions des objets géométriques courants ainsi que des opérateurs agissant sur eux. GATr est équivariant par rapport à E(3), le groupe de symétrie de l'espace euclidien en 3D. En tant que transformeur, GATr est évolutif, expressif et polyvalent. Dans des expériences de modélisation de systèmes à N corps et de planification robotique, GATr montre des améliorations significatives par rapport aux modèles de référence non géométriques.
English
Problems involving geometric data arise in a variety of fields, including
computer vision, robotics, chemistry, and physics. Such data can take numerous
forms, such as points, direction vectors, planes, or transformations, but to
date there is no single architecture that can be applied to such a wide variety
of geometric types while respecting their symmetries. In this paper we
introduce the Geometric Algebra Transformer (GATr), a general-purpose
architecture for geometric data. GATr represents inputs, outputs, and hidden
states in the projective geometric algebra, which offers an efficient
16-dimensional vector space representation of common geometric objects as well
as operators acting on them. GATr is equivariant with respect to E(3), the
symmetry group of 3D Euclidean space. As a transformer, GATr is scalable,
expressive, and versatile. In experiments with n-body modeling and robotic
planning, GATr shows strong improvements over non-geometric baselines.