ChatPaper.aiChatPaper

CoRe3D: 3D知能の基盤としての協調的推論

CoRe3D: Collaborative Reasoning as a Foundation for 3D Intelligence

December 14, 2025
著者: Tianjiao Yu, Xinzhuo Li, Yifan Shen, Yuanzhe Liu, Ismini Lourentzou
cs.AI

要旨

大規模マルチモーダルモデルの最近の進歩は、明示的な推論メカニズムがモデルの信頼性、解釈可能性、およびクロスモーダル連携の向上に重要な役割を果たすことを示唆している。このような推論中心のアプローチは言語タスクや視覚タスクで有効性が証明されているが、3D領域への拡張は未だ発展途上である。CoRe3Dは、意味的抽象化と空間的抽象化の両方に対して共同で動作する統合的な3D理解・生成推論フレームワークを提案し、言語から推論された高次意図が低次元の3Dコンテンツ形成を直接導くことを可能にする。この設計の中核となるのは、3D潜在空間を局所化された領域に分解する空間的に接地された推論表現であり、モデルが合成的かつ手続き的な方法で幾何学情報を推論することを可能にする。意味的な連鎖思考推論と構造化された空間推論を緊密に結合させることで、CoRe3Dは強い局所的一貫性と言語記述への忠実な連携を示す3D出力を生成する。
English
Recent advances in large multimodal models suggest that explicit reasoning mechanisms play a critical role in improving model reliability, interpretability, and cross-modal alignment. While such reasoning-centric approaches have been proven effective in language and vision tasks, their extension to 3D remains underdeveloped. CoRe3D introduces a unified 3D understanding and generation reasoning framework that jointly operates over semantic and spatial abstractions, enabling high-level intent inferred from language to directly guide low-level 3D content formation. Central to this design is a spatially grounded reasoning representation that decomposes 3D latent space into localized regions, allowing the model to reason over geometry in a compositional and procedural manner. By tightly coupling semantic chain-of-thought inference with structured spatial reasoning, CoRe3D produces 3D outputs that exhibit strong local consistency and faithful alignment with linguistic descriptions.
PDF12December 17, 2025