CoRe3D: El Razonamiento Colaborativo como Base para la Inteligencia 3D
CoRe3D: Collaborative Reasoning as a Foundation for 3D Intelligence
December 14, 2025
Autores: Tianjiao Yu, Xinzhuo Li, Yifan Shen, Yuanzhe Liu, Ismini Lourentzou
cs.AI
Resumen
Los recientes avances en los modelos multimodales de gran escala sugieren que los mecanismos de razonamiento explícito desempeñan un papel fundamental en la mejora de la fiabilidad, interpretabilidad y alineación multimodal de los modelos. Si bien estos enfoques centrados en el razonamiento han demostrado ser eficaces en tareas de lenguaje y visión, su extensión al ámbito 3D sigue estando poco desarrollada. CoRe3D introduce un marco unificado de razonamiento para la comprensión y generación 3D que opera conjuntamente sobre abstracciones semánticas y espaciales, permitiendo que la intención de alto nivel inferida del lenguaje guíe directamente la formación de contenido 3D de bajo nivel. Elemento central de este diseño es una representación de razonamiento espacialmente anclada que descompone el espacio latente 3D en regiones localizadas, permitiendo al modelo razonar sobre la geometría de manera composicional y procedural. Al acoplar estrechamente la inferencia semántica de cadena de pensamiento con el razonamiento espacial estructurado, CoRe3D genera resultados 3D que exhiben una fuerte consistencia local y una alineación fiel con las descripciones lingüísticas.
English
Recent advances in large multimodal models suggest that explicit reasoning mechanisms play a critical role in improving model reliability, interpretability, and cross-modal alignment. While such reasoning-centric approaches have been proven effective in language and vision tasks, their extension to 3D remains underdeveloped. CoRe3D introduces a unified 3D understanding and generation reasoning framework that jointly operates over semantic and spatial abstractions, enabling high-level intent inferred from language to directly guide low-level 3D content formation. Central to this design is a spatially grounded reasoning representation that decomposes 3D latent space into localized regions, allowing the model to reason over geometry in a compositional and procedural manner. By tightly coupling semantic chain-of-thought inference with structured spatial reasoning, CoRe3D produces 3D outputs that exhibit strong local consistency and faithful alignment with linguistic descriptions.