AI-Salesman: Verso un Agente di Telemarketing Affidabile Basato su Modelli Linguistici di Grande Dimensione
AI-Salesman: Towards Reliable Large Language Model Driven Telemarketing
November 15, 2025
Autori: Qingyu Zhang, Chunlei Xin, Xuanang Chen, Yaojie Lu, Hongyu Lin, Xianpei Han, Le Sun, Qing Ye, Qianlong Xie, Xingxing Wang
cs.AI
Abstract
Il dialogo persuasivo orientato a uno scopo, esemplificato da applicazioni come il telemarketing, richiede una sofisticata pianificazione a più turni e una rigorosa fedeltà fattuale, che rimane una sfida significativa anche per i più avanzati Modelli Linguistici di Grande Dimensione (LLM). La mancanza di dati specifici per il compito ha spesso limitato i lavori precedenti, e l'applicazione diretta degli LLM soffre di fragilità strategica e allucinazioni fattuali. In questo articolo, prima costruiamo e rilasciamo TeleSalesCorpus, il primo dataset di dialogo radicato nel mondo reale per questo dominio. Proponiamo quindi AI-Salesman, un framework innovativo caratterizzato da un'architettura a doppio stadio. Per la fase di addestramento, progettiamo un algoritmo di apprendimento per rinforzo bayesiano-supervisionato che apprende strategie di vendita robuste da dialoghi rumorosi. Per la fase di inferenza, introduciamo l'Agente Guidato da Schema Dinamico (DOGA), che sfrutta una libreria di script pre-costruita per fornire una guida strategica dinamica, turno per turno. Inoltre, progettiamo un framework di valutazione completo che combina metriche granulari per le competenze chiave di vendita con il paradigma LLM-as-a-Judge. I risultati sperimentali dimostrano che il nostro AI-Salesman supera significativamente i modelli di base sia nelle metriche automatiche che nelle valutazioni umane complete, dimostrando la sua efficacia in scenari persuasivi complessi.
English
Goal-driven persuasive dialogue, exemplified by applications like telemarketing, requires sophisticated multi-turn planning and strict factual faithfulness, which remains a significant challenge for even state-of-the-art Large Language Models (LLMs). A lack of task-specific data often limits previous works, and direct LLM application suffers from strategic brittleness and factual hallucination. In this paper, we first construct and release TeleSalesCorpus, the first real-world-grounded dialogue dataset for this domain. We then propose AI-Salesman, a novel framework featuring a dual-stage architecture. For the training stage, we design a Bayesian-supervised reinforcement learning algorithm that learns robust sales strategies from noisy dialogues. For the inference stage, we introduce the Dynamic Outline-Guided Agent (DOGA), which leverages a pre-built script library to provide dynamic, turn-by-turn strategic guidance. Moreover, we design a comprehensive evaluation framework that combines fine-grained metrics for key sales skills with the LLM-as-a-Judge paradigm. Experimental results demonstrate that our proposed AI-Salesman significantly outperforms baseline models in both automatic metrics and comprehensive human evaluations, showcasing its effectiveness in complex persuasive scenarios.