El Espacio Latente: Fundamentos, Evolución, Mecanismos, Capacidades y Perspectivas
The Latent Space: Foundation, Evolution, Mechanism, Ability, and Outlook
April 2, 2026
Autores: Xinlei Yu, Zhangquan Chen, Yongbo He, Tianyu Fu, Cheng Yang, Chengming Xu, Yue Ma, Xiaobin Hu, Zhe Cao, Jie Xu, Guibin Zhang, Jiale Tao, Jiayi Zhang, Siyuan Ma, Kaituo Feng, Haojie Huang, Youxing Li, Ronghao Chen, Huacan Wang, Chenglin Wu, Zikun Su, Xiaogang Xu, Kelu Yao, Kun Wang, Chen Gao, Yue Liao, Ruqi Huang, Tao Jin, Cheng Tan, Jiangning Zhang, Wenqi Ren, Yanwei Fu, Yong Liu, Yu Wang, Xiangyu Yue, Yu-Gang Jiang, Shuicheng Yan
cs.AI
Resumen
El espacio latente está emergiendo rápidamente como un sustrato nativo para los modelos basados en lenguaje. Si bien los sistemas modernos aún se comprenden comúnmente a través de la generación explícita a nivel de tokens, un número creciente de trabajos demuestra que muchos procesos internos críticos se llevan a cabo de manera más natural en el espacio latente continuo que en las trazas verbales legibles para humanos. Este cambio está impulsado por las limitaciones estructurales de la computación en espacio explícito, incluyendo la redundancia lingüística, los cuellos de botella por discretización, la ineficiencia secuencial y la pérdida semántica. Esta revisión tiene como objetivo proporcionar un panorama unificado y actualizado del espacio latente en los modelos basados en lenguaje. Organizamos la revisión en cinco perspectivas secuenciales: Fundamentos, Evolución, Mecanismo, Capacidad y Perspectivas. Comenzamos delimitando el alcance del espacio latente, distinguiéndolo del espacio explícito o verbal y de los espacios latentes comúnmente estudiados en modelos visuales generativos. Luego, rastreamos la evolución del campo, desde los primeros esfuerzos exploratorios hasta la actual expansión a gran escala. Para organizar el panorama técnico, examinamos el trabajo existente a través de las lentes complementarias de mecanismo y capacidad. Desde la perspectiva del Mecanismo, identificamos cuatro grandes líneas de desarrollo: Arquitectura, Representación, Computación y Optimización. Desde la perspectiva de la Capacidad, mostramos cómo el espacio latente soporta un amplio espectro de capacidades que abarcan el Razonamiento, la Planificación, el Modelado, la Percepción, la Memoria, la Colaboración y la Corporalización. Más allá de la consolidación, discutimos los principales desafíos abiertos y esbozamos direcciones prometedoras para la investigación futura. Esperamos que esta revisión sirva no solo como referencia para el trabajo existente, sino también como base para comprender el espacio latente como un paradigma computacional y de sistemas general para la inteligencia de próxima generación.
English
Latent space is rapidly emerging as a native substrate for language-based models. While modern systems are still commonly understood through explicit token-level generation, an increasing body of work shows that many critical internal processes are more naturally carried out in continuous latent space than in human-readable verbal traces. This shift is driven by the structural limitations of explicit-space computation, including linguistic redundancy, discretization bottlenecks, sequential inefficiency, and semantic loss. This survey aims to provide a unified and up-to-date landscape of latent space in language-based models. We organize the survey into five sequential perspectives: Foundation, Evolution, Mechanism, Ability, and Outlook. We begin by delineating the scope of latent space, distinguishing it from explicit or verbal space and from the latent spaces commonly studied in generative visual models. We then trace the field's evolution from early exploratory efforts to the current large-scale expansion. To organize the technical landscape, we examine existing work through the complementary lenses of mechanism and ability. From the perspective of Mechanism, we identify four major lines of development: Architecture, Representation, Computation, and Optimization. From the perspective of Ability, we show how latent space supports a broad capability spectrum spanning Reasoning, Planning, Modeling, Perception, Memory, Collaboration, and Embodiment. Beyond consolidation, we discuss the key open challenges, and outline promising directions for future research. We hope this survey serves not only as a reference for existing work, but also as a foundation for understanding latent space as a general computational and systems paradigm for next-generation intelligence.