HSG: Grafo de Cena Hiperbólico
HSG: Hyperbolic Scene Graph
April 19, 2026
Autores: Liyang Wang, Zeyu Zhang, Hao Tang
cs.AI
Resumo
As representações de grafos de cena permitem a compreensão visual estruturada através da modelação de objetos e das suas relações, sendo amplamente utilizadas para o raciocínio multivista e 3D de cenas. Métodos existentes, como o MSG, aprendem incorporações de grafos de cena no espaço euclidiano usando aprendizagem contrastiva e associação baseada em atenção. No entanto, a geometria euclidiana não capta explicitamente as relações de hierarquia e implicação entre locais e objetos, limitando a consistência estrutural das representações aprendidas. Para resolver esta limitação, propomos o Grafo de Cena Hiperbólico (HSG), que aprende incorporações de grafos de cena no espaço hiperbólico, onde as relações hierárquicas são naturalmente codificadas através da distância geométrica. Os nossos resultados mostram que o HSG melhora a qualidade da estrutura hierárquica, mantendo um forte desempenho na recuperação de informação. Os ganhos mais significativos são observados em métricas a nível do grafo: o HSG alcança um PP IoU de 33,17 e o Graph IoU mais alto de 33,51, superando a melhor variante do AoMSG (25,37) em 8,14, destacando a eficácia da aprendizagem de representações hiperbólicas para a modelação de grafos de cena. Código: https://github.com/AIGeeksGroup/HSG.
English
Scene graph representations enable structured visual understanding by modeling objects and their relationships, and have been widely used for multiview and 3D scene reasoning. Existing methods such as MSG learn scene graph embeddings in Euclidean space using contrastive learning and attention based association. However, Euclidean geometry does not explicitly capture hierarchical entailment relationships between places and objects, limiting the structural consistency of learned representations. To address this, we propose Hyperbolic Scene Graph (HSG), which learns scene graph embeddings in hyperbolic space where hierarchical relationships are naturally encoded through geometric distance. Our results show that HSG improves hierarchical structure quality while maintaining strong retrieval performance. The largest gains are observed in graph level metrics: HSG achieves a PP IoU of 33.17 and the highest Graph IoU of 33.51, outperforming the best AoMSG variant (25.37) by 8.14, highlighting the effectiveness of hyperbolic representation learning for scene graph modeling. Code: https://github.com/AIGeeksGroup/HSG.