ChatPaper.aiChatPaper

AIセールスマン:信頼性の高い大規模言語モデル駆動型テレマーケティングに向けて

AI-Salesman: Towards Reliable Large Language Model Driven Telemarketing

November 15, 2025
著者: Qingyu Zhang, Chunlei Xin, Xuanang Chen, Yaojie Lu, Hongyu Lin, Xianpei Han, Le Sun, Qing Ye, Qianlong Xie, Xingxing Wang
cs.AI

要旨

目的駆動型説得対話は、テレマーケティングなどの応用に代表されるが、高度なマルチターン計画と厳密な事実正確性が要求され、これは最先端の大規模言語モデル(LLM)にとっても重大な課題である。従来研究はタスク特化データの不足に制限され、LLMの直接応用は戦略的脆弱性や事実に関する虚構生成(ハルシネーション)の問題を抱える。本論文ではまず、この領域初の実世界に基づく対話データセットであるTeleSalesCorpusを構築し公開する。次に、新規フレームワークAI-Salesmanを提案する。これは二段階アーキテクチャを特徴とし、訓練段階では、ノイズの多い対話からロバストな販売戦略を学習するベイズ監督強化学習アルゴリズムを設計する。推論段階では、事前構築されたスクリプトライブラリを活用し、ターン単位の動的战略ガイダンスを提供するDynamic Outline-Guided Agent(DOGA)を導入する。さらに、主要販売スキルに対する細粒度指標とLLM-as-a-Judgeパラダイムを組み合わせた総合評価フレームワークを設計する。実験結果から、提案するAI-Salesmanが自動評価指標および総合的な人間評価の両方においてベースラインモデルを大幅に上回り、複雑な説得シナリオにおける有効性が実証された。
English
Goal-driven persuasive dialogue, exemplified by applications like telemarketing, requires sophisticated multi-turn planning and strict factual faithfulness, which remains a significant challenge for even state-of-the-art Large Language Models (LLMs). A lack of task-specific data often limits previous works, and direct LLM application suffers from strategic brittleness and factual hallucination. In this paper, we first construct and release TeleSalesCorpus, the first real-world-grounded dialogue dataset for this domain. We then propose AI-Salesman, a novel framework featuring a dual-stage architecture. For the training stage, we design a Bayesian-supervised reinforcement learning algorithm that learns robust sales strategies from noisy dialogues. For the inference stage, we introduce the Dynamic Outline-Guided Agent (DOGA), which leverages a pre-built script library to provide dynamic, turn-by-turn strategic guidance. Moreover, we design a comprehensive evaluation framework that combines fine-grained metrics for key sales skills with the LLM-as-a-Judge paradigm. Experimental results demonstrate that our proposed AI-Salesman significantly outperforms baseline models in both automatic metrics and comprehensive human evaluations, showcasing its effectiveness in complex persuasive scenarios.
PDF12December 1, 2025