O Espaço Latente: Fundamentos, Evolução, Mecanismo, Capacidades e Perspectivas
The Latent Space: Foundation, Evolution, Mechanism, Ability, and Outlook
April 2, 2026
Autores: Xinlei Yu, Zhangquan Chen, Yongbo He, Tianyu Fu, Cheng Yang, Chengming Xu, Yue Ma, Xiaobin Hu, Zhe Cao, Jie Xu, Guibin Zhang, Jiale Tao, Jiayi Zhang, Siyuan Ma, Kaituo Feng, Haojie Huang, Youxing Li, Ronghao Chen, Huacan Wang, Chenglin Wu, Zikun Su, Xiaogang Xu, Kelu Yao, Kun Wang, Chen Gao, Yue Liao, Ruqi Huang, Tao Jin, Cheng Tan, Jiangning Zhang, Wenqi Ren, Yanwei Fu, Yong Liu, Yu Wang, Xiangyu Yue, Yu-Gang Jiang, Shuicheng Yan
cs.AI
Resumo
O espaço latente está rapidamente emergindo como um substrato nativo para modelos baseados em linguagem. Embora os sistemas modernos ainda sejam comumente compreendidos por meio da geração explícita em nível de token, um corpo crescente de trabalho demonstra que muitos processos internos críticos são realizados mais naturalmente no espaço latente contínuo do que em traços verbais legíveis por humanos. Essa mudança é impulsionada pelas limitações estruturais da computação no espaço explícito, incluindo redundância linguística, gargalos de discretização, ineficiência sequencial e perda semântica. Esta revisão tem como objetivo fornecer um panorama unificado e atualizado do espaço latente em modelos baseados em linguagem. Organizamos a revisão em cinco perspectivas sequenciais: Fundação, Evolução, Mecanismo, Capacidade e Perspetivas. Começamos por delinear o âmbito do espaço latente, distinguindo-o do espaço explícito ou verbal e dos espaços latentes comumente estudados em modelos visuais generativos. Em seguida, traçamos a evolução do campo, desde os primeiros esforços exploratórios até a atual expansão em larga escala. Para organizar o panorama técnico, examinamos o trabalho existente através das lentes complementares de mecanismo e capacidade. Da perspetiva do Mecanismo, identificamos quatro grandes linhas de desenvolvimento: Arquitetura, Representação, Computação e Otimização. Da perspetiva da Capacidade, mostramos como o espaço latente suporta um amplo espectro de capacidades que abrange Raciocínio, Planeamento, Modelagem, Perceção, Memória, Colaboração e Corporificação. Para além da consolidação, discutimos os principais desafios em aberto e delineamos direções promissoras para pesquisas futuras. Esperamos que esta revisão sirva não apenas como referência para o trabalho existente, mas também como base para compreender o espaço latente como um paradigma computacional e de sistemas geral para a inteligência de próxima geração.
English
Latent space is rapidly emerging as a native substrate for language-based models. While modern systems are still commonly understood through explicit token-level generation, an increasing body of work shows that many critical internal processes are more naturally carried out in continuous latent space than in human-readable verbal traces. This shift is driven by the structural limitations of explicit-space computation, including linguistic redundancy, discretization bottlenecks, sequential inefficiency, and semantic loss. This survey aims to provide a unified and up-to-date landscape of latent space in language-based models. We organize the survey into five sequential perspectives: Foundation, Evolution, Mechanism, Ability, and Outlook. We begin by delineating the scope of latent space, distinguishing it from explicit or verbal space and from the latent spaces commonly studied in generative visual models. We then trace the field's evolution from early exploratory efforts to the current large-scale expansion. To organize the technical landscape, we examine existing work through the complementary lenses of mechanism and ability. From the perspective of Mechanism, we identify four major lines of development: Architecture, Representation, Computation, and Optimization. From the perspective of Ability, we show how latent space supports a broad capability spectrum spanning Reasoning, Planning, Modeling, Perception, Memory, Collaboration, and Embodiment. Beyond consolidation, we discuss the key open challenges, and outline promising directions for future research. We hope this survey serves not only as a reference for existing work, but also as a foundation for understanding latent space as a general computational and systems paradigm for next-generation intelligence.