RotaTouille: Apprendimento Profondo Equivariante alla Rotazione per Contorni
RotaTouille: Rotation Equivariant Deep Learning for Contours
August 22, 2025
Autori: Odin Hoff Gardaa, Nello Blaser
cs.AI
Abstract
I contorni o le curve piane chiuse sono comuni in molti ambiti. Ad esempio, compaiono come bordi di oggetti nella visione artificiale, come isolette in meteorologia e come orbite di macchinari rotanti. In molti casi, quando si apprende da dati di contorno, le rotazioni piane dell'input produrranno output corrispondentemente ruotati. È quindi auspicabile che i modelli di deep learning siano equivarianti rispetto alle rotazioni. Inoltre, i contorni sono tipicamente rappresentati come una sequenza ordinata di punti di bordo, dove la scelta del punto di partenza è arbitraria. È quindi anche desiderabile che i metodi di deep learning siano equivarianti rispetto agli spostamenti ciclici. Presentiamo RotaTouille, un framework di deep learning per l'apprendimento da dati di contorno che raggiunge sia l'equivarianza rispetto alle rotazioni che agli spostamenti ciclici attraverso la convoluzione circolare a valori complessi. Introduciamo inoltre e caratterizziamo non linearità equivarianti, strati di coarsening e strati di pooling globale per ottenere rappresentazioni invarianti per compiti downstream. Infine, dimostriamo l'efficacia di RotaTouille attraverso esperimenti di classificazione di forme, ricostruzione e regressione di contorni.
English
Contours or closed planar curves are common in many domains. For example,
they appear as object boundaries in computer vision, isolines in meteorology,
and the orbits of rotating machinery. In many cases when learning from contour
data, planar rotations of the input will result in correspondingly rotated
outputs. It is therefore desirable that deep learning models be rotationally
equivariant. In addition, contours are typically represented as an ordered
sequence of edge points, where the choice of starting point is arbitrary. It is
therefore also desirable for deep learning methods to be equivariant under
cyclic shifts. We present RotaTouille, a deep learning framework for learning
from contour data that achieves both rotation and cyclic shift equivariance
through complex-valued circular convolution. We further introduce and
characterize equivariant non-linearities, coarsening layers, and global pooling
layers to obtain invariant representations for downstream tasks. Finally, we
demonstrate the effectiveness of RotaTouille through experiments in shape
classification, reconstruction, and contour regression.