ChatPaper.aiChatPaper

GPT-Calls : Amélioration de la segmentation et de l'étiquetage des appels grâce à la génération de conversations synthétiques via des modèles de langage à grande échelle

GPT-Calls: Enhancing Call Segmentation and Tagging by Generating Synthetic Conversations via Large Language Models

June 9, 2023
Auteurs: Itzik Malkiel, Uri Alon, Yakir Yehuda, Shahar Keren, Oren Barkan, Royi Ronen, Noam Koenigstein
cs.AI

Résumé

Les transcriptions d'appels téléphoniques revêtent une importance significative dans divers domaines, tels que les ventes, le service client, la santé et l'application de la loi. Cependant, l'analyse de ces conversations enregistrées peut s'avérer laborieuse et chronophage, en particulier lorsqu'il s'agit de dialogues longs ou complexes. Dans ce travail, nous proposons une nouvelle méthode, GPT-distilled Calls Segmentation and Tagging (GPT-Calls), pour une segmentation et une extraction de thèmes efficaces et précises des appels. GPT-Calls se compose de phases hors ligne et en ligne. La phase hors ligne est appliquée une seule fois à une liste donnée de thèmes et implique la génération d'une distribution de phrases synthétiques pour chaque thème à l'aide d'un modèle GPT, ainsi que l'extraction de vecteurs d'ancrage. La phase en ligne est appliquée séparément à chaque appel et évalue la similarité entre la conversation transcrite et les ancres de thèmes identifiées lors de la phase hors ligne. Ensuite, une analyse dans le domaine temporel est appliquée aux scores de similarité pour regrouper les énoncés en segments et les étiqueter avec des thèmes. Le paradigme proposé offre une méthode précise et efficace pour la segmentation des appels et l'extraction de thèmes qui ne nécessite pas de données étiquetées, ce qui en fait une approche polyvalente applicable à divers domaines. Notre algorithme fonctionne en production sous Dynamics 365 Sales Conversation Intelligence, et notre recherche est basée sur des conversations de vente réelles collectées auprès de divers locataires de Dynamics 365 Sales.
English
Transcriptions of phone calls are of significant value across diverse fields, such as sales, customer service, healthcare, and law enforcement. Nevertheless, the analysis of these recorded conversations can be an arduous and time-intensive process, especially when dealing with extended or multifaceted dialogues. In this work, we propose a novel method, GPT-distilled Calls Segmentation and Tagging (GPT-Calls), for efficient and accurate call segmentation and topic extraction. GPT-Calls is composed of offline and online phases. The offline phase is applied once to a given list of topics and involves generating a distribution of synthetic sentences for each topic using a GPT model and extracting anchor vectors. The online phase is applied to every call separately and scores the similarity between the transcripted conversation and the topic anchors found in the offline phase. Then, time domain analysis is applied to the similarity scores to group utterances into segments and tag them with topics. The proposed paradigm provides an accurate and efficient method for call segmentation and topic extraction that does not require labeled data, thus making it a versatile approach applicable to various domains. Our algorithm operates in production under Dynamics 365 Sales Conversation Intelligence, and our research is based on real sales conversations gathered from various Dynamics 365 Sales tenants.
PDF30December 15, 2024