RotaTouille: Rotatie-equivariant diep leren voor contouren
RotaTouille: Rotation Equivariant Deep Learning for Contours
August 22, 2025
Auteurs: Odin Hoff Gardaa, Nello Blaser
cs.AI
Samenvatting
Contouren of gesloten vlakke krommen komen veel voor in verschillende domeinen. Ze verschijnen bijvoorbeeld als objectgrenzen in computervisie, isolijnen in de meteorologie en de banen van roterende machines. In veel gevallen, wanneer er wordt geleerd van contourgegevens, zullen vlakke rotaties van de invoer resulteren in overeenkomstig geroteerde uitvoer. Het is daarom wenselijk dat deep learning-modellen rotatie-equivariant zijn. Bovendien worden contouren doorgaans weergegeven als een geordende reeks randpunten, waarbij de keuze van het startpunt willekeurig is. Het is daarom ook wenselijk dat deep learning-methoden equivariant zijn onder cyclische verschuivingen. Wij presenteren RotaTouille, een deep learning-framework voor het leren van contourgegevens dat zowel rotatie- als cyclische verschuiving-equivariantie bereikt door middel van complexwaardige circulaire convolutie. We introduceren en karakteriseren verder equivariante niet-lineariteiten, verruwingslagen en globale pooling-lagen om invariante representaties te verkrijgen voor downstream taken. Tot slot demonstreren we de effectiviteit van RotaTouille via experimenten in vormclassificatie, reconstructie en contourregressie.
English
Contours or closed planar curves are common in many domains. For example,
they appear as object boundaries in computer vision, isolines in meteorology,
and the orbits of rotating machinery. In many cases when learning from contour
data, planar rotations of the input will result in correspondingly rotated
outputs. It is therefore desirable that deep learning models be rotationally
equivariant. In addition, contours are typically represented as an ordered
sequence of edge points, where the choice of starting point is arbitrary. It is
therefore also desirable for deep learning methods to be equivariant under
cyclic shifts. We present RotaTouille, a deep learning framework for learning
from contour data that achieves both rotation and cyclic shift equivariance
through complex-valued circular convolution. We further introduce and
characterize equivariant non-linearities, coarsening layers, and global pooling
layers to obtain invariant representations for downstream tasks. Finally, we
demonstrate the effectiveness of RotaTouille through experiments in shape
classification, reconstruction, and contour regression.