ChatPaper.aiChatPaper

CoRe3D: Collaboratief Redeneren als Fundament voor 3D-intelligentie

CoRe3D: Collaborative Reasoning as a Foundation for 3D Intelligence

December 14, 2025
Auteurs: Tianjiao Yu, Xinzhuo Li, Yifan Shen, Yuanzhe Liu, Ismini Lourentzou
cs.AI

Samenvatting

Recente vooruitgang in grote multimodale modellen suggereert dat expliciete redeneermechanismen een cruciale rol spelen bij het verbeteren van de modelbetrouwbaarheid, interpreteerbaarheid en cross-modale afstemming. Hoewel dergelijke reasoning-gecentreerde benaderingen effectief zijn gebleken voor taal- en visietaken, blijft hun uitbreiding naar 3D onderontwikkeld. CoRe3D introduceert een uniform 3D-begrips- en generatieredeneerkader dat gezamenlijk opereert op semantische en ruimtelijke abstracties, waardoor hoogwaardige intentie afgeleid uit taal de laagwaardige 3D-inhoudsvorming direct kan sturen. Centraal in dit ontwerp staat een ruimtelijk verankerde reasoning-representatie die de 3D-latente ruimte decomposeert in gelokaliseerde regio's, waardoor het model op een compositionele en procedurele manier over geometrie kan redeneren. Door semantische keten-van-gedachten-inferentie nauw te koppelen aan gestructureerd ruimtelijk redeneren, produceert CoRe3D 3D-uitvoer die sterke lokale consistentie en getrouwe afstemming met linguïstische beschrijvingen vertoont.
English
Recent advances in large multimodal models suggest that explicit reasoning mechanisms play a critical role in improving model reliability, interpretability, and cross-modal alignment. While such reasoning-centric approaches have been proven effective in language and vision tasks, their extension to 3D remains underdeveloped. CoRe3D introduces a unified 3D understanding and generation reasoning framework that jointly operates over semantic and spatial abstractions, enabling high-level intent inferred from language to directly guide low-level 3D content formation. Central to this design is a spatially grounded reasoning representation that decomposes 3D latent space into localized regions, allowing the model to reason over geometry in a compositional and procedural manner. By tightly coupling semantic chain-of-thought inference with structured spatial reasoning, CoRe3D produces 3D outputs that exhibit strong local consistency and faithful alignment with linguistic descriptions.
PDF22December 22, 2025