HSG: Grafo della Scena Iperbolico
HSG: Hyperbolic Scene Graph
April 19, 2026
Autori: Liyang Wang, Zeyu Zhang, Hao Tang
cs.AI
Abstract
Le rappresentazioni mediante scene graph consentono una comprensione visiva strutturata modellando oggetti e le loro relazioni, e sono ampiamente utilizzate per il ragionamento su scene multiview e 3D. Metodi esistenti come MSG apprendono embedding di scene graph nello spazio euclideo utilizzando l'apprendimento contrastivo e associazioni basate sull'attenzione. Tuttavia, la geometria euclidea non cattura esplicitamente le relazioni di implicazione gerarchica tra luoghi e oggetti, limitando la consistenza strutturale delle rappresentazioni apprese. Per risolvere questo problema, proponiamo Hyperbolic Scene Graph (HSG), che apprende embedding di scene graph nello spazio iperbolico, dove le relazioni gerarchiche sono naturalmente codificate attraverso la distanza geometrica. I nostri risultati mostrano che HSG migliora la qualità della struttura gerarchica mantenendo al contempo solide prestazioni di retrieval. I miglioramenti più significativi si osservano nelle metriche a livello di grafo: HSG raggiunge un PP IoU di 33.17 e il Graph IoU più alto di 33.51, superando la migliore variante di AoMSG (25.37) di 8.14, evidenziando l'efficacia dell'apprendimento di rappresentazioni iperboliche per la modellazione di scene graph. Codice: https://github.com/AIGeeksGroup/HSG.
English
Scene graph representations enable structured visual understanding by modeling objects and their relationships, and have been widely used for multiview and 3D scene reasoning. Existing methods such as MSG learn scene graph embeddings in Euclidean space using contrastive learning and attention based association. However, Euclidean geometry does not explicitly capture hierarchical entailment relationships between places and objects, limiting the structural consistency of learned representations. To address this, we propose Hyperbolic Scene Graph (HSG), which learns scene graph embeddings in hyperbolic space where hierarchical relationships are naturally encoded through geometric distance. Our results show that HSG improves hierarchical structure quality while maintaining strong retrieval performance. The largest gains are observed in graph level metrics: HSG achieves a PP IoU of 33.17 and the highest Graph IoU of 33.51, outperforming the best AoMSG variant (25.37) by 8.14, highlighting the effectiveness of hyperbolic representation learning for scene graph modeling. Code: https://github.com/AIGeeksGroup/HSG.