Allineamento degli Obiettivi nei Simulatori di Utente Basati su LLM per l'Intelligenza Conversazionale

Abstract

I simulator di utenti sono essenziali per l'IA conversazionale, consentendo lo sviluppo e la valutazione scalabile degli agenti attraverso interazioni simulate. Sebbene gli attuali Modelli Linguistici di Grande Dimensione (LLM) abbiano avanzato le capacità di simulazione degli utenti, riveliamo che faticano a dimostrare comportamenti orientati agli obiettivi in modo coerente attraverso conversazioni multi-turn—una limitazione critica che compromette la loro affidabilità nelle applicazioni downstream. Introduciamo il User Goal State Tracking (UGST), un framework innovativo che monitora il progresso degli obiettivi dell'utente durante le conversazioni. Sfruttando UGST, presentiamo una metodologia in tre fasi per sviluppare simulatori di utenti in grado di monitorare autonomamente il progresso degli obiettivi e ragionare per generare risposte allineate agli obiettivi. Inoltre, stabiliamo metriche di valutazione complete per misurare l'allineamento agli obiettivi nei simulatori di utenti e dimostriamo che il nostro approccio produce miglioramenti sostanziali su due benchmark (MultiWOZ 2.4 e {\tau}-Bench). I nostri contributi affrontano una lacuna critica nell'IA conversazionale e stabiliscono UGST come un framework essenziale per sviluppare simulatori di utenti allineati agli obiettivi.

English

User simulators are essential to conversational AI, enabling scalable agent development and evaluation through simulated interactions. While current Large Language Models (LLMs) have advanced user simulation capabilities, we reveal that they struggle to consistently demonstrate goal-oriented behavior across multi-turn conversations--a critical limitation that compromises their reliability in downstream applications. We introduce User Goal State Tracking (UGST), a novel framework that tracks user goal progression throughout conversations. Leveraging UGST, we present a three-stage methodology for developing user simulators that can autonomously track goal progression and reason to generate goal-aligned responses. Moreover, we establish comprehensive evaluation metrics for measuring goal alignment in user simulators, and demonstrate that our approach yields substantial improvements across two benchmarks (MultiWOZ 2.4 and {\tau}-Bench). Our contributions address a critical gap in conversational AI and establish UGST as an essential framework for developing goal-aligned user simulators.

Allineamento degli Obiettivi nei Simulatori di Utente Basati su LLM per l'Intelligenza Conversazionale

Goal Alignment in LLM-Based User Simulators for Conversational AI

Abstract

Support