GPT-Calls: Mejorando la Segmentación y Etiquetado de Llamadas mediante la Generación de Conversaciones Sintéticas con Modelos de Lenguaje a Gran Escala
GPT-Calls: Enhancing Call Segmentation and Tagging by Generating Synthetic Conversations via Large Language Models
June 9, 2023
Autores: Itzik Malkiel, Uri Alon, Yakir Yehuda, Shahar Keren, Oren Barkan, Royi Ronen, Noam Koenigstein
cs.AI
Resumen
Las transcripciones de llamadas telefónicas tienen un valor significativo en diversos campos, como ventas, servicio al cliente, atención médica y aplicación de la ley. Sin embargo, el análisis de estas conversaciones grabadas puede ser un proceso arduo y que consume mucho tiempo, especialmente cuando se trata de diálogos extensos o multifacéticos. En este trabajo, proponemos un método novedoso, Segmentación y Etiquetado de Llamadas Destilado por GPT (GPT-Calls), para una segmentación y extracción de temas eficiente y precisa. GPT-Calls se compone de fases en línea y fuera de línea. La fase fuera de línea se aplica una vez a una lista determinada de temas e implica generar una distribución de oraciones sintéticas para cada tema utilizando un modelo GPT y extraer vectores de anclaje. La fase en línea se aplica a cada llamada por separado y califica la similitud entre la conversación transcrita y los anclajes de temas encontrados en la fase fuera de línea. Luego, se aplica un análisis en el dominio del tiempo a las puntuaciones de similitud para agrupar las expresiones en segmentos y etiquetarlas con temas. El paradigma propuesto ofrece un método preciso y eficiente para la segmentación de llamadas y la extracción de temas que no requiere datos etiquetados, lo que lo convierte en un enfoque versátil aplicable a diversos dominios. Nuestro algoritmo opera en producción bajo Dynamics 365 Sales Conversation Intelligence, y nuestra investigación se basa en conversaciones de ventas reales recopiladas de varios inquilinos de Dynamics 365 Sales.
English
Transcriptions of phone calls are of significant value across diverse fields,
such as sales, customer service, healthcare, and law enforcement. Nevertheless,
the analysis of these recorded conversations can be an arduous and
time-intensive process, especially when dealing with extended or multifaceted
dialogues. In this work, we propose a novel method, GPT-distilled Calls
Segmentation and Tagging (GPT-Calls), for efficient and accurate call
segmentation and topic extraction. GPT-Calls is composed of offline and online
phases. The offline phase is applied once to a given list of topics and
involves generating a distribution of synthetic sentences for each topic using
a GPT model and extracting anchor vectors. The online phase is applied to every
call separately and scores the similarity between the transcripted conversation
and the topic anchors found in the offline phase. Then, time domain analysis is
applied to the similarity scores to group utterances into segments and tag them
with topics. The proposed paradigm provides an accurate and efficient method
for call segmentation and topic extraction that does not require labeled data,
thus making it a versatile approach applicable to various domains. Our
algorithm operates in production under Dynamics 365 Sales Conversation
Intelligence, and our research is based on real sales conversations gathered
from various Dynamics 365 Sales tenants.