RotaTouille: 輪郭のための回転同変深層学習
RotaTouille: Rotation Equivariant Deep Learning for Contours
August 22, 2025
著者: Odin Hoff Gardaa, Nello Blaser
cs.AI
要旨
輪郭や閉じた平面曲線は、多くの分野で一般的に見られます。例えば、コンピュータビジョンでは物体の境界として、気象学では等値線として、回転機械の軌道として現れます。輪郭データから学習する際、入力の平面回転は対応する出力の回転を引き起こすことが多く、そのため深層学習モデルが回転等変性を持つことが望ましいです。さらに、輪郭は通常、エッジ点の順序付きシーケンスとして表現され、開始点の選択は任意です。そのため、深層学習手法が巡回シフトに対して等変性を持つことも望ましいです。本論文では、複素数値の円形畳み込みを通じて回転と巡回シフトの等変性を実現する輪郭データ学習のための深層学習フレームワーク「RotaTouille」を提案します。さらに、等変性を持つ非線形層、粗化層、およびグローバルプーリング層を導入し、下流タスクのための不変表現を獲得します。最後に、形状分類、再構成、輪郭回帰の実験を通じてRotaTouilleの有効性を実証します。
English
Contours or closed planar curves are common in many domains. For example,
they appear as object boundaries in computer vision, isolines in meteorology,
and the orbits of rotating machinery. In many cases when learning from contour
data, planar rotations of the input will result in correspondingly rotated
outputs. It is therefore desirable that deep learning models be rotationally
equivariant. In addition, contours are typically represented as an ordered
sequence of edge points, where the choice of starting point is arbitrary. It is
therefore also desirable for deep learning methods to be equivariant under
cyclic shifts. We present RotaTouille, a deep learning framework for learning
from contour data that achieves both rotation and cyclic shift equivariance
through complex-valued circular convolution. We further introduce and
characterize equivariant non-linearities, coarsening layers, and global pooling
layers to obtain invariant representations for downstream tasks. Finally, we
demonstrate the effectiveness of RotaTouille through experiments in shape
classification, reconstruction, and contour regression.