Quem Deve Liderar a Decodificação Agora? Rastreando Trajetórias Confiáveis para o Agrupamento de Modelos de Linguagem de Difusão Mascarados

Resumo

Modelos de Linguagem de Difusão Mascarada (MDLMs) emergiram como um paradigma distinto para geração de sequências. À medida que os MDLMs se tornam diversos em capacidades e cobertura de conhecimento, surge uma questão importante sobre como combinar seus conhecimentos. Nesse sentido, investigamos primeiro as dinâmicas únicas de decodificação dos MDLMs. Descobrimos que gerações bem-sucedidas exibem dinâmicas estáveis de confiança sobre posições relevantes para a resposta, enquanto trajetórias não confiáveis podem frequentemente ser corrigidas pela injeção de estados intermediários promissores de outros modelos. Guiados por essa observação, propomos o TIE (Ensemblagem Iterativa Baseada em Trajetórias), uma estrutura de fusão de conhecimento na qual MDLMs identificam iterativamente trajetórias confiáveis de decodificação e as retransmitem entre modelos. O TIE monitora as dinâmicas de confiança sobre posições relevantes para a resposta para determinar qual modelo segue atualmente uma trajetória mais confiável e transfere seletivamente sequências parcialmente desruídas entre modelos. Como o modelo na trajetória mais promissora frequentemente muda ao longo das etapas de desruído, o TIE permite que diferentes modelos contribuam com forças complementares em diferentes estágios da geração. O forte desempenho em diversas tarefas de raciocínio, juntamente com nossas análises, sugere que o TIE oferece uma abordagem prática para o problema pouco explorado da ensemblagem de MDLMs.

English

Masked Diffusion Language Models (MDLMs) have emerged as a distinct paradigm for sequence generation. As MDLMs become diverse in capabilities and knowledge coverage, an important question is how to combine their knowledge. Toward this, we first investigate the unique decoding dynamics of MDLMs. We find that successful generations exhibit stable confidence dynamics over answer-relevant positions, while unreliable trajectories can often be corrected by injecting promising intermediate states from other models. Guided by this observation, we propose TIE (Trajectory-based Iterative Ensembling), a knowledge fusion framework in which MDLMs iteratively identify reliable decoding trajectories and relay them across models. TIE tracks confidence dynamics over answer-relevant positions to determine which model currently follows a more reliable trajectory and selectively transfers partially denoised sequences across models. As the model on the more promising trajectory often changes across denoising steps, TIE allows different models to contribute complementary strengths at different stages of generation. Strong performance across diverse reasoning tasks, along with our analyses, suggests that TIE offers a practical approach to the underexplored problem of MDLM ensembling.