Wie zou nu het decoderen moeten leiden? Het volgen van betrouwbare trajecten voor het ensembleren van gemaskeerde diffusie-taalmodellen

Samenvatting

Gemaskeerde Diffusie Taalmodellen (MDLMs) zijn uitgekristalliseerd als een eigen paradigma voor sequentiegeneratie. Naarmate MDLMs diverser worden in capaciteiten en kennisdekking, rijst de belangrijke vraag hoe hun kennis te combineren. Hiertoe onderzoeken we eerst de unieke decoderingsdynamiek van MDLMs. We ontdekken dat succesvolle generaties stabiele betrouwbaarheidsdynamiek vertonen over antwoordrelevante posities, terwijl onbetrouwbare trajecten vaak kunnen worden gecorrigeerd door het injecteren van veelbelovende tussentoestanden van andere modellen. Geleid door deze observatie stellen we TIE (Iteratief Ensemble op Basis van Trajecten) voor, een kennisintegratieraamwerk waarin MDLMs iteratief betrouwbare decoderingsbanen identificeren en deze doorgeven tussen modellen. TIE volgt de betrouwbaarheidsdynamiek over antwoordrelevante posities om te bepalen welk model op dat moment een betrouwbaarder traject volgt en selectief gedeeltelijk ontruiste sequenties overdraagt tussen modellen. Omdat het model op het veelbelovendere traject vaak verandert tijdens ontruisingsstappen, stelt TIE verschillende modellen in staat om complementaire sterktes bij te dragen in verschillende fasen van de generatie. Sterke prestaties op diverse redeneertaken, samen met onze analyses, suggereren dat TIE een praktische benadering biedt voor het onderbelichte probleem van MDLM-ensembling.

English

Masked Diffusion Language Models (MDLMs) have emerged as a distinct paradigm for sequence generation. As MDLMs become diverse in capabilities and knowledge coverage, an important question is how to combine their knowledge. Toward this, we first investigate the unique decoding dynamics of MDLMs. We find that successful generations exhibit stable confidence dynamics over answer-relevant positions, while unreliable trajectories can often be corrected by injecting promising intermediate states from other models. Guided by this observation, we propose TIE (Trajectory-based Iterative Ensembling), a knowledge fusion framework in which MDLMs iteratively identify reliable decoding trajectories and relay them across models. TIE tracks confidence dynamics over answer-relevant positions to determine which model currently follows a more reliable trajectory and selectively transfers partially denoised sequences across models. As the model on the more promising trajectory often changes across denoising steps, TIE allows different models to contribute complementary strengths at different stages of generation. Strong performance across diverse reasoning tasks, along with our analyses, suggests that TIE offers a practical approach to the underexplored problem of MDLM ensembling.