RotaTouille: Ротационно-эквивариантное глубокое обучение для контуров
RotaTouille: Rotation Equivariant Deep Learning for Contours
August 22, 2025
Авторы: Odin Hoff Gardaa, Nello Blaser
cs.AI
Аннотация
Контуры или замкнутые плоские кривые широко распространены во многих областях. Например, они встречаются как границы объектов в компьютерном зрении, изолинии в метеорологии и орбиты вращающихся механизмов. Во многих случаях при обучении на данных контуров плоские вращения входных данных приводят к соответствующим вращениям выходных данных. Поэтому желательно, чтобы модели глубокого обучения были эквивариантны относительно вращений. Кроме того, контуры обычно представляются в виде упорядоченной последовательности точек границы, где выбор начальной точки произволен. Следовательно, также желательно, чтобы методы глубокого обучения были эквивариантны относительно циклических сдвигов. Мы представляем RotaTouille — фреймворк глубокого обучения для работы с данными контуров, который достигает эквивариантности как относительно вращений, так и циклических сдвигов с помощью комплекснозначной круговой свертки. Мы также вводим и характеризуем эквивариантные нелинейности, слои сжатия и глобальные слои пулинга для получения инвариантных представлений для последующих задач. Наконец, мы демонстрируем эффективность RotaTouille в экспериментах по классификации форм, реконструкции и регрессии контуров.
English
Contours or closed planar curves are common in many domains. For example,
they appear as object boundaries in computer vision, isolines in meteorology,
and the orbits of rotating machinery. In many cases when learning from contour
data, planar rotations of the input will result in correspondingly rotated
outputs. It is therefore desirable that deep learning models be rotationally
equivariant. In addition, contours are typically represented as an ordered
sequence of edge points, where the choice of starting point is arbitrary. It is
therefore also desirable for deep learning methods to be equivariant under
cyclic shifts. We present RotaTouille, a deep learning framework for learning
from contour data that achieves both rotation and cyclic shift equivariance
through complex-valued circular convolution. We further introduce and
characterize equivariant non-linearities, coarsening layers, and global pooling
layers to obtain invariant representations for downstream tasks. Finally, we
demonstrate the effectiveness of RotaTouille through experiments in shape
classification, reconstruction, and contour regression.