RotaTouille: Aprendizado Profundo Equivariante à Rotação para Contornos
RotaTouille: Rotation Equivariant Deep Learning for Contours
August 22, 2025
Autores: Odin Hoff Gardaa, Nello Blaser
cs.AI
Resumo
Contornos ou curvas planares fechadas são comuns em muitos domínios. Por exemplo, eles aparecem como limites de objetos em visão computacional, isolinhas em meteorologia e as órbitas de máquinas rotativas. Em muitos casos, ao aprender a partir de dados de contorno, rotações planares da entrada resultarão em saídas correspondentes rotacionadas. Portanto, é desejável que modelos de aprendizado profundo sejam equivariantes a rotações. Além disso, os contornos são tipicamente representados como uma sequência ordenada de pontos de borda, onde a escolha do ponto inicial é arbitrária. Assim, também é desejável que métodos de aprendizado profundo sejam equivariantes sob deslocamentos cíclicos. Apresentamos o RotaTouille, uma estrutura de aprendizado profundo para aprender a partir de dados de contorno que alcança tanto a equivariância a rotações quanto a deslocamentos cíclicos por meio de convolução circular com valores complexos. Além disso, introduzimos e caracterizamos não linearidades equivariantes, camadas de redução e camadas de pooling global para obter representações invariantes para tarefas subsequentes. Por fim, demonstramos a eficácia do RotaTouille por meio de experimentos em classificação de formas, reconstrução e regressão de contornos.
English
Contours or closed planar curves are common in many domains. For example,
they appear as object boundaries in computer vision, isolines in meteorology,
and the orbits of rotating machinery. In many cases when learning from contour
data, planar rotations of the input will result in correspondingly rotated
outputs. It is therefore desirable that deep learning models be rotationally
equivariant. In addition, contours are typically represented as an ordered
sequence of edge points, where the choice of starting point is arbitrary. It is
therefore also desirable for deep learning methods to be equivariant under
cyclic shifts. We present RotaTouille, a deep learning framework for learning
from contour data that achieves both rotation and cyclic shift equivariance
through complex-valued circular convolution. We further introduce and
characterize equivariant non-linearities, coarsening layers, and global pooling
layers to obtain invariant representations for downstream tasks. Finally, we
demonstrate the effectiveness of RotaTouille through experiments in shape
classification, reconstruction, and contour regression.