ChatPaper.aiChatPaper

Alineación de Objetivos en Simuladores de Usuario Basados en LLM para IA Conversacional

Goal Alignment in LLM-Based User Simulators for Conversational AI

July 27, 2025
Autores: Shuhaib Mehri, Xiaocheng Yang, Takyoung Kim, Gokhan Tur, Shikib Mehri, Dilek Hakkani-Tür
cs.AI

Resumen

Los simuladores de usuarios son esenciales para la IA conversacional, permitiendo el desarrollo y evaluación escalable de agentes a través de interacciones simuladas. Si bien los modelos de lenguaje de gran escala (LLMs, por sus siglas en inglés) actuales han avanzado en capacidades de simulación de usuarios, revelamos que tienen dificultades para demostrar consistentemente un comportamiento orientado a objetivos en conversaciones de múltiples turnos, una limitación crítica que compromete su confiabilidad en aplicaciones posteriores. Introducimos el Seguimiento del Estado del Objetivo del Usuario (UGST, por sus siglas en inglés), un marco novedoso que rastrea el progreso del objetivo del usuario a lo largo de las conversaciones. Aprovechando UGST, presentamos una metodología de tres etapas para desarrollar simuladores de usuarios que puedan rastrear de manera autónoma el progreso del objetivo y razonar para generar respuestas alineadas con el objetivo. Además, establecemos métricas de evaluación integrales para medir la alineación con el objetivo en los simuladores de usuarios, y demostramos que nuestro enfoque produce mejoras sustanciales en dos puntos de referencia (MultiWOZ 2.4 y {\tau}-Bench). Nuestras contribuciones abordan una brecha crítica en la IA conversacional y establecen UGST como un marco esencial para desarrollar simuladores de usuarios alineados con objetivos.
English
User simulators are essential to conversational AI, enabling scalable agent development and evaluation through simulated interactions. While current Large Language Models (LLMs) have advanced user simulation capabilities, we reveal that they struggle to consistently demonstrate goal-oriented behavior across multi-turn conversations--a critical limitation that compromises their reliability in downstream applications. We introduce User Goal State Tracking (UGST), a novel framework that tracks user goal progression throughout conversations. Leveraging UGST, we present a three-stage methodology for developing user simulators that can autonomously track goal progression and reason to generate goal-aligned responses. Moreover, we establish comprehensive evaluation metrics for measuring goal alignment in user simulators, and demonstrate that our approach yields substantial improvements across two benchmarks (MultiWOZ 2.4 and {\tau}-Bench). Our contributions address a critical gap in conversational AI and establish UGST as an essential framework for developing goal-aligned user simulators.
PDF42July 29, 2025