GPT-Calls: Miglioramento della Segmentazione e dell'Etichettatura delle Chiamate mediante la Generazione di Conversazioni Sintetiche tramite Modelli Linguistici di Grande Scala
GPT-Calls: Enhancing Call Segmentation and Tagging by Generating Synthetic Conversations via Large Language Models
June 9, 2023
Autori: Itzik Malkiel, Uri Alon, Yakir Yehuda, Shahar Keren, Oren Barkan, Royi Ronen, Noam Koenigstein
cs.AI
Abstract
Le trascrizioni delle telefonate hanno un valore significativo in diversi ambiti, come vendite, assistenza clienti, sanità e forze dell'ordine. Tuttavia, l'analisi di queste conversazioni registrate può essere un processo arduo e dispendioso in termini di tempo, specialmente quando si ha a che fare con dialoghi estesi o complessi. In questo lavoro, proponiamo un metodo innovativo, GPT-distilled Calls Segmentation and Tagging (GPT-Calls), per una segmentazione e un'estrazione dei temi delle chiamate efficiente e accurata. GPT-Calls è composto da fasi offline e online. La fase offline viene applicata una volta a una determinata lista di argomenti e prevede la generazione di una distribuzione di frasi sintetiche per ciascun argomento utilizzando un modello GPT e l'estrazione di vettori di ancoraggio. La fase online viene applicata separatamente a ogni chiamata e calcola la similarità tra la conversazione trascritta e gli ancoraggi tematici individuati nella fase offline. Successivamente, un'analisi nel dominio del tempo viene applicata ai punteggi di similarità per raggruppare le espressioni in segmenti e assegnare loro i temi. Il paradigma proposto offre un metodo accurato ed efficiente per la segmentazione delle chiamate e l'estrazione dei temi che non richiede dati etichettati, rendendolo un approccio versatile applicabile a vari domini. Il nostro algoritmo opera in produzione sotto Dynamics 365 Sales Conversation Intelligence, e la nostra ricerca si basa su conversazioni di vendita reali raccolte da vari tenant di Dynamics 365 Sales.
English
Transcriptions of phone calls are of significant value across diverse fields,
such as sales, customer service, healthcare, and law enforcement. Nevertheless,
the analysis of these recorded conversations can be an arduous and
time-intensive process, especially when dealing with extended or multifaceted
dialogues. In this work, we propose a novel method, GPT-distilled Calls
Segmentation and Tagging (GPT-Calls), for efficient and accurate call
segmentation and topic extraction. GPT-Calls is composed of offline and online
phases. The offline phase is applied once to a given list of topics and
involves generating a distribution of synthetic sentences for each topic using
a GPT model and extracting anchor vectors. The online phase is applied to every
call separately and scores the similarity between the transcripted conversation
and the topic anchors found in the offline phase. Then, time domain analysis is
applied to the similarity scores to group utterances into segments and tag them
with topics. The proposed paradigm provides an accurate and efficient method
for call segmentation and topic extraction that does not require labeled data,
thus making it a versatile approach applicable to various domains. Our
algorithm operates in production under Dynamics 365 Sales Conversation
Intelligence, and our research is based on real sales conversations gathered
from various Dynamics 365 Sales tenants.