ChatPaper.aiChatPaper

Transformeurs d'Algèbre Géométrique

Geometric Algebra Transformers

May 28, 2023
Auteurs: Johann Brehmer, Pim de Haan, Sönke Behrends, Taco Cohen
cs.AI

Résumé

Les problèmes impliquant des données géométriques apparaissent dans divers domaines, notamment la vision par ordinateur, la robotique, la chimie et la physique. Ces données peuvent prendre de nombreuses formes, telles que des points, des vecteurs directionnels, des plans ou des transformations, mais à ce jour, il n'existe pas d'architecture unique pouvant être appliquée à une telle variété de types géométriques tout en respectant leurs symétries. Dans cet article, nous présentons le Geometric Algebra Transformer (GATr), une architecture polyvalente pour les données géométriques. GATr représente les entrées, les sorties et les états cachés dans l'algèbre géométrique projective, qui offre une représentation efficace en espace vectoriel à 16 dimensions des objets géométriques courants ainsi que des opérateurs agissant sur eux. GATr est équivariant par rapport à E(3), le groupe de symétrie de l'espace euclidien en 3D. En tant que transformeur, GATr est évolutif, expressif et polyvalent. Dans des expériences de modélisation de systèmes à N corps et de planification robotique, GATr montre des améliorations significatives par rapport aux modèles de référence non géométriques.
English
Problems involving geometric data arise in a variety of fields, including computer vision, robotics, chemistry, and physics. Such data can take numerous forms, such as points, direction vectors, planes, or transformations, but to date there is no single architecture that can be applied to such a wide variety of geometric types while respecting their symmetries. In this paper we introduce the Geometric Algebra Transformer (GATr), a general-purpose architecture for geometric data. GATr represents inputs, outputs, and hidden states in the projective geometric algebra, which offers an efficient 16-dimensional vector space representation of common geometric objects as well as operators acting on them. GATr is equivariant with respect to E(3), the symmetry group of 3D Euclidean space. As a transformer, GATr is scalable, expressive, and versatile. In experiments with n-body modeling and robotic planning, GATr shows strong improvements over non-geometric baselines.
PDF20December 15, 2024