RotaTouille: Aprendizaje Profundo Equivariante a Rotaciones para Contornos
RotaTouille: Rotation Equivariant Deep Learning for Contours
August 22, 2025
Autores: Odin Hoff Gardaa, Nello Blaser
cs.AI
Resumen
Los contornos o curvas planas cerradas son comunes en muchos dominios. Por ejemplo, aparecen como límites de objetos en visión por computadora, isolíneas en meteorología y las órbitas de maquinaria rotativa. En muchos casos, al aprender a partir de datos de contornos, las rotaciones planas de la entrada darán lugar a salidas correspondientemente rotadas. Por lo tanto, es deseable que los modelos de aprendizaje profundo sean equivariantes a la rotación. Además, los contornos suelen representarse como una secuencia ordenada de puntos de borde, donde la elección del punto de partida es arbitraria. Por ello, también es deseable que los métodos de aprendizaje profundo sean equivariantes bajo desplazamientos cíclicos. Presentamos RotaTouille, un marco de aprendizaje profundo para aprender a partir de datos de contornos que logra la equivariancia tanto a la rotación como al desplazamiento cíclico mediante convolución circular de valores complejos. Además, introducimos y caracterizamos no linealidades equivariantes, capas de reducción y capas de agrupación global para obtener representaciones invariantes para tareas posteriores. Finalmente, demostramos la efectividad de RotaTouille a través de experimentos en clasificación de formas, reconstrucción y regresión de contornos.
English
Contours or closed planar curves are common in many domains. For example,
they appear as object boundaries in computer vision, isolines in meteorology,
and the orbits of rotating machinery. In many cases when learning from contour
data, planar rotations of the input will result in correspondingly rotated
outputs. It is therefore desirable that deep learning models be rotationally
equivariant. In addition, contours are typically represented as an ordered
sequence of edge points, where the choice of starting point is arbitrary. It is
therefore also desirable for deep learning methods to be equivariant under
cyclic shifts. We present RotaTouille, a deep learning framework for learning
from contour data that achieves both rotation and cyclic shift equivariance
through complex-valued circular convolution. We further introduce and
characterize equivariant non-linearities, coarsening layers, and global pooling
layers to obtain invariant representations for downstream tasks. Finally, we
demonstrate the effectiveness of RotaTouille through experiments in shape
classification, reconstruction, and contour regression.