KI-Verkäufer: Auf dem Weg zu zuverlässigen, großsprachmodellgestützten Telefonverkaufsgesprächen
AI-Salesman: Towards Reliable Large Language Model Driven Telemarketing
November 15, 2025
papers.authors: Qingyu Zhang, Chunlei Xin, Xuanang Chen, Yaojie Lu, Hongyu Lin, Xianpei Han, Le Sun, Qing Ye, Qianlong Xie, Xingxing Wang
cs.AI
papers.abstract
Zielorientierte persuasive Dialoge, wie sie beispielsweise im Telemarketing Anwendung finden, erfordern anspruchsvolle Mehrschritt-Planung und strikte faktische Korrektheit – eine erhebliche Herausforderung auch für modernste Großsprachmodelle (Large Language Models, LLMs). Bisherige Arbeiten sind häufig durch einen Mangel an aufgabenspezifischen Daten eingeschränkt, und der direkte Einsatz von LLMs leidet unter strategischer Brüchigkeit und faktischen Halluzinationen. In diesem Beitrag stellen wir zunächst TeleSalesCorpus vor, den ersten auf realen Daten basierenden Dialogdatensatz für diesen Bereich, und veröffentlichen ihn. Anschließend präsentieren wir AI-Salesman, einen neuartigen Rahmen mit einer zweistufigen Architektur. Für die Trainingsphase entwickeln wir einen bayessianisch überwachten Reinforcement-Learning-Algorithmus, der robuste Verkaufsstrategien aus verrauschten Dialogen erlernt. Für die Inferenzphase führen wir den Dynamic Outline-Guided Agent (DOGA) ein, der eine vordefinierte Skriptbibliothek zur dynamischen, schrittweisen strategischen Steuerung nutzt. Darüber hinaus entwerfen wir ein umfassendes Bewertungsframework, das feinkörnige Metriken für Schlüsselverkaufskompetenzen mit dem LLM-as-a-Judge-Paradigma kombiniert. Experimentelle Ergebnisse belegen, dass unser AI-Salesman Baseline-Modelle sowohl in automatischen Metriken als auch in umfassenden menschlichen Evaluationen signifikant übertrifft und seine Wirksamkeit in komplexen persuasiven Szenarien unter Beweis stellt.
English
Goal-driven persuasive dialogue, exemplified by applications like telemarketing, requires sophisticated multi-turn planning and strict factual faithfulness, which remains a significant challenge for even state-of-the-art Large Language Models (LLMs). A lack of task-specific data often limits previous works, and direct LLM application suffers from strategic brittleness and factual hallucination. In this paper, we first construct and release TeleSalesCorpus, the first real-world-grounded dialogue dataset for this domain. We then propose AI-Salesman, a novel framework featuring a dual-stage architecture. For the training stage, we design a Bayesian-supervised reinforcement learning algorithm that learns robust sales strategies from noisy dialogues. For the inference stage, we introduce the Dynamic Outline-Guided Agent (DOGA), which leverages a pre-built script library to provide dynamic, turn-by-turn strategic guidance. Moreover, we design a comprehensive evaluation framework that combines fine-grained metrics for key sales skills with the LLM-as-a-Judge paradigm. Experimental results demonstrate that our proposed AI-Salesman significantly outperforms baseline models in both automatic metrics and comprehensive human evaluations, showcasing its effectiveness in complex persuasive scenarios.