HSG: 双曲線空間シーングラフ
HSG: Hyperbolic Scene Graph
April 19, 2026
著者: Liyang Wang, Zeyu Zhang, Hao Tang
cs.AI
要旨
シーングラフ表現は、物体とその関係をモデル化することで構造化された視覚理解を実現し、マルチビューおよび3次元シーン推論に広く用いられてきた。既存手法(例:MSG)は、対比学習と注意機構に基づく関連付けを用いて、ユークリッド空間内でシーングラフの埋め込みを学習する。しかし、ユークリッド幾何学は場所と物体間の階層的包含関係を明示的に捉えることができず、学習された表現の構造的一貫性を制限する。この問題に対処するため、我々は双曲空間でシーングラフの埋め込みを学習するHyperbolic Scene Graph(HSG)を提案する。双曲空間では幾何学的距離を通じて階層関係が自然に符号化される。実験結果から、HSGは強力な検索性能を維持しつつ階層構造の質を向上させることが示された。特にグラフレベル指標で最大の改善が観測され、HSGはPP IoUで33.17、Graph IoUで最高値の33.51を達成し、最良のAoMSG変種(25.37)を8.14上回り、シーングラフモデリングにおける双曲表現学習の有効性が明らかとなった。コード:https://github.com/AIGeeksGroup/HSG
English
Scene graph representations enable structured visual understanding by modeling objects and their relationships, and have been widely used for multiview and 3D scene reasoning. Existing methods such as MSG learn scene graph embeddings in Euclidean space using contrastive learning and attention based association. However, Euclidean geometry does not explicitly capture hierarchical entailment relationships between places and objects, limiting the structural consistency of learned representations. To address this, we propose Hyperbolic Scene Graph (HSG), which learns scene graph embeddings in hyperbolic space where hierarchical relationships are naturally encoded through geometric distance. Our results show that HSG improves hierarchical structure quality while maintaining strong retrieval performance. The largest gains are observed in graph level metrics: HSG achieves a PP IoU of 33.17 and the highest Graph IoU of 33.51, outperforming the best AoMSG variant (25.37) by 8.14, highlighting the effectiveness of hyperbolic representation learning for scene graph modeling. Code: https://github.com/AIGeeksGroup/HSG.