Planejamento em 8 Tokens: Um Tokenizador Discreto Compacto para Modelos de Mundo Latentes
Planning in 8 Tokens: A Compact Discrete Tokenizer for Latent World Model
March 5, 2026
Autores: Dongwon Kim, Gawon Seo, Jinsung Lee, Minsu Cho, Suha Kwak
cs.AI
Resumo
Os modelos de mundo fornecem uma estrutura poderosa para simular a dinâmica do ambiente condicionada a ações ou instruções, permitindo tarefas subsequentes, como planeamento de ações ou aprendizagem de políticas. Abordagens recentes utilizam modelos de mundo como simuladores aprendidos, mas a sua aplicação ao planeamento no momento da decisão permanece computacionalmente proibitiva para controlo em tempo real. Um dos principais estrangulamentos reside nas representações latentes: os tokenizadores convencionais codificam cada observação em centenas de tokens, tornando o planeamento lento e com uso intensivo de recursos. Para resolver isso, propomos o CompACT, um tokenizador discreto que comprime cada observação em apenas 8 tokens, reduzindo drasticamente o custo computacional enquanto preserva informações essenciais para o planeamento. Um modelo de mundo condicionado por ação que incorpora o tokenizador CompACT alcança desempenho de planeamento competitivo com ordens de grandeza de aceleração, oferecendo um passo prático para a implantação no mundo real de modelos de mundo.
English
World models provide a powerful framework for simulating environment dynamics conditioned on actions or instructions, enabling downstream tasks such as action planning or policy learning. Recent approaches leverage world models as learned simulators, but its application to decision-time planning remains computationally prohibitive for real-time control. A key bottleneck lies in latent representations: conventional tokenizers encode each observation into hundreds of tokens, making planning both slow and resource-intensive. To address this, we propose CompACT, a discrete tokenizer that compresses each observation into as few as 8 tokens, drastically reducing computational cost while preserving essential information for planning. An action-conditioned world model that occupies CompACT tokenizer achieves competitive planning performance with orders-of-magnitude faster planning, offering a practical step toward real-world deployment of world models.