Cuando la confianza engaña: Anclaje de sufijos y modulación de confianza por proximidad al ancla para modelos de lenguaje de difusión
When Confidence Misleads: Suffix Anchoring and Anchor-Proximity Confidence Modulation for Diffusion Language Models
May 27, 2026
Autores: Jungwon Park, Jimyeong Kim, Jungmin Ko, Nojun Kwak, Wonjong Rhee
cs.AI
Resumen
Los modelos de lenguaje de difusión decodifican texto eliminando ruido de manera iterativa en secuencias de tokens enmascarados, lo que convierte la elección de qué posiciones decodificar en una decisión central en tiempo de inferencia. La mayoría de las estrategias de decodificación sin entrenamiento utilizan la confianza del modelo para la selección de posiciones, asumiendo que las posiciones de alta confianza están listas para ser decodificadas. En este trabajo, revisitamos esta suposición estudiando cuándo la confianza induce a error en la decodificación completamente no autorregresiva (completamente no AR). Los tokens EOT pueden recibir alta confianza y provocar una generación incompleta; insertar un ancla de sufijo puede mitigar este problema, pero introduce sobreconfianza local cerca del ancla, lo que provoca que los tokens adyacentes al ancla se decodifiquen demasiado pronto. Para abordar estos problemas, proponemos Modulación de Confianza con Anclaje de Sufijo, un método simple sin entrenamiento que inserta un ancla de sufijo corta para incentivar la finalización de la respuesta y modula la confianza cerca del ancla según el progreso de la decodificación. Esto conserva el beneficio de finalización de respuesta del anclaje de sufijo, al tiempo que reduce la decodificación prematura de tokens adyacentes al ancla. En puntos de referencia de razonamiento solo textual, razonamiento visión-lenguaje y generación de código, nuestro método mejora consistentemente la decodificación completamente no AR basada en confianza, supera la supresión explícita de EOT y preserva la ventaja de decodificación paralela de la generación completamente no AR.
English
Diffusion language models decode text by iteratively denoising masked token sequences, making the choice of which positions to decode a central inference-time decision. Most training-free decoding strategies use model confidence for position selection, assuming that high-confidence positions are ready to be decoded. In this work, we revisit this assumption by studying when confidence misleads fully non-autoregressive (fully non-AR) decoding. EOT tokens can receive high confidence and cause incomplete generation; inserting a suffix anchor can mitigate this issue but introduces local overconfidence near the anchor, causing anchor-adjacent tokens to be decoded too early. To address these issues, we propose Suffix-Anchored Confidence Modulation, a simple training-free method that inserts a short suffix anchor to encourage response completion and modulates confidence near the anchor according to decoding progress. This preserves the response-completion benefit of suffix anchoring while reducing premature decoding of anchor-adjacent tokens. Across text-only reasoning, vision-language reasoning, and code-generation benchmarks, our method consistently improves confidence-based fully non-AR decoding, outperforms explicit EOT suppression, and preserves the parallel decoding advantage of fully non-AR generation.