ChatPaper.aiChatPaper

GPT-Calls: Mejorando la Segmentación y Etiquetado de Llamadas mediante la Generación de Conversaciones Sintéticas con Modelos de Lenguaje a Gran Escala

GPT-Calls: Enhancing Call Segmentation and Tagging by Generating Synthetic Conversations via Large Language Models

June 9, 2023
Autores: Itzik Malkiel, Uri Alon, Yakir Yehuda, Shahar Keren, Oren Barkan, Royi Ronen, Noam Koenigstein
cs.AI

Resumen

Las transcripciones de llamadas telefónicas tienen un valor significativo en diversos campos, como ventas, servicio al cliente, atención médica y aplicación de la ley. Sin embargo, el análisis de estas conversaciones grabadas puede ser un proceso arduo y que consume mucho tiempo, especialmente cuando se trata de diálogos extensos o multifacéticos. En este trabajo, proponemos un método novedoso, Segmentación y Etiquetado de Llamadas Destilado por GPT (GPT-Calls), para una segmentación y extracción de temas eficiente y precisa. GPT-Calls se compone de fases en línea y fuera de línea. La fase fuera de línea se aplica una vez a una lista determinada de temas e implica generar una distribución de oraciones sintéticas para cada tema utilizando un modelo GPT y extraer vectores de anclaje. La fase en línea se aplica a cada llamada por separado y califica la similitud entre la conversación transcrita y los anclajes de temas encontrados en la fase fuera de línea. Luego, se aplica un análisis en el dominio del tiempo a las puntuaciones de similitud para agrupar las expresiones en segmentos y etiquetarlas con temas. El paradigma propuesto ofrece un método preciso y eficiente para la segmentación de llamadas y la extracción de temas que no requiere datos etiquetados, lo que lo convierte en un enfoque versátil aplicable a diversos dominios. Nuestro algoritmo opera en producción bajo Dynamics 365 Sales Conversation Intelligence, y nuestra investigación se basa en conversaciones de ventas reales recopiladas de varios inquilinos de Dynamics 365 Sales.
English
Transcriptions of phone calls are of significant value across diverse fields, such as sales, customer service, healthcare, and law enforcement. Nevertheless, the analysis of these recorded conversations can be an arduous and time-intensive process, especially when dealing with extended or multifaceted dialogues. In this work, we propose a novel method, GPT-distilled Calls Segmentation and Tagging (GPT-Calls), for efficient and accurate call segmentation and topic extraction. GPT-Calls is composed of offline and online phases. The offline phase is applied once to a given list of topics and involves generating a distribution of synthetic sentences for each topic using a GPT model and extracting anchor vectors. The online phase is applied to every call separately and scores the similarity between the transcripted conversation and the topic anchors found in the offline phase. Then, time domain analysis is applied to the similarity scores to group utterances into segments and tag them with topics. The proposed paradigm provides an accurate and efficient method for call segmentation and topic extraction that does not require labeled data, thus making it a versatile approach applicable to various domains. Our algorithm operates in production under Dynamics 365 Sales Conversation Intelligence, and our research is based on real sales conversations gathered from various Dynamics 365 Sales tenants.
PDF30December 15, 2024