ChatPaper.aiChatPaper

GPT-Calls: Verbesserung der Gesprächssegmentierung und -kennzeichnung durch die Generierung synthetischer Konversationen mittels großer Sprachmodelle

GPT-Calls: Enhancing Call Segmentation and Tagging by Generating Synthetic Conversations via Large Language Models

June 9, 2023
Autoren: Itzik Malkiel, Uri Alon, Yakir Yehuda, Shahar Keren, Oren Barkan, Royi Ronen, Noam Koenigstein
cs.AI

Zusammenfassung

Transkriptionen von Telefongesprächen sind in verschiedenen Bereichen von erheblichem Wert, wie beispielsweise im Vertrieb, Kundenservice, Gesundheitswesen und in der Strafverfolgung. Dennoch kann die Analyse dieser aufgezeichneten Gespräche ein mühsamer und zeitintensiver Prozess sein, insbesondere bei langen oder komplexen Dialogen. In dieser Arbeit schlagen wir eine neuartige Methode vor, GPT-distilled Calls Segmentation and Tagging (GPT-Calls), für eine effiziente und präzise Segmentierung und Themenextraktion von Gesprächen. GPT-Calls besteht aus Offline- und Online-Phasen. Die Offline-Phase wird einmal auf eine gegebene Liste von Themen angewendet und umfasst die Generierung einer Verteilung synthetischer Sätze für jedes Thema mithilfe eines GPT-Modells sowie die Extraktion von Ankervektoren. Die Online-Phase wird auf jedes Gespräch separat angewendet und bewertet die Ähnlichkeit zwischen dem transkribierten Gespräch und den in der Offline-Phase ermittelten Themenankern. Anschließend wird eine Zeitbereichsanalyse auf die Ähnlichkeitswerte angewendet, um Äußerungen in Segmente zu gruppieren und sie mit Themen zu versehen. Das vorgeschlagene Paradigma bietet eine präzise und effiziente Methode für die Segmentierung und Themenextraktion von Gesprächen, die keine annotierten Daten erfordert, wodurch es sich als vielseitiger Ansatz für verschiedene Domänen eignet. Unser Algorithmus wird in der Produktion unter Dynamics 365 Sales Conversation Intelligence eingesetzt, und unsere Forschung basiert auf realen Vertriebsgesprächen, die von verschiedenen Dynamics 365 Sales-Mandanten gesammelt wurden.
English
Transcriptions of phone calls are of significant value across diverse fields, such as sales, customer service, healthcare, and law enforcement. Nevertheless, the analysis of these recorded conversations can be an arduous and time-intensive process, especially when dealing with extended or multifaceted dialogues. In this work, we propose a novel method, GPT-distilled Calls Segmentation and Tagging (GPT-Calls), for efficient and accurate call segmentation and topic extraction. GPT-Calls is composed of offline and online phases. The offline phase is applied once to a given list of topics and involves generating a distribution of synthetic sentences for each topic using a GPT model and extracting anchor vectors. The online phase is applied to every call separately and scores the similarity between the transcripted conversation and the topic anchors found in the offline phase. Then, time domain analysis is applied to the similarity scores to group utterances into segments and tag them with topics. The proposed paradigm provides an accurate and efficient method for call segmentation and topic extraction that does not require labeled data, thus making it a versatile approach applicable to various domains. Our algorithm operates in production under Dynamics 365 Sales Conversation Intelligence, and our research is based on real sales conversations gathered from various Dynamics 365 Sales tenants.
PDF30December 15, 2024