ChatPaper.aiChatPaper

GPT-Calls: 대규모 언어 모델을 통한 합성 대화 생성으로 전화 분할 및 태깅 기능 강화

GPT-Calls: Enhancing Call Segmentation and Tagging by Generating Synthetic Conversations via Large Language Models

June 9, 2023
저자: Itzik Malkiel, Uri Alon, Yakir Yehuda, Shahar Keren, Oren Barkan, Royi Ronen, Noam Koenigstein
cs.AI

초록

전화 통화 기록은 영업, 고객 서비스, 의료, 법 집행 등 다양한 분야에서 상당한 가치를 지닙니다. 그러나 이러한 녹음된 대화를 분석하는 작업은 특히 길거나 복잡한 대화를 다룰 때 매우 힘들고 시간이 많이 소요되는 과정일 수 있습니다. 본 연구에서는 효율적이고 정확한 통화 분할 및 주제 추출을 위한 새로운 방법론인 GPT-distilled Calls Segmentation and Tagging(GPT-Calls)을 제안합니다. GPT-Calls는 오프라인 단계와 온라인 단계로 구성됩니다. 오프라인 단계는 주어진 주제 목록에 대해 한 번 적용되며, GPT 모델을 사용하여 각 주제에 대한 합성 문장 분포를 생성하고 앵커 벡터를 추출하는 과정을 포함합니다. 온라인 단계는 각 통화에 개별적으로 적용되며, 전사된 대화와 오프라인 단계에서 찾은 주제 앵커 간의 유사성을 점수화합니다. 그런 다음, 유사성 점수에 시간 영역 분석을 적용하여 발화를 세그먼트로 그룹화하고 주제로 태깅합니다. 제안된 패러다임은 레이블이 지정된 데이터가 필요 없이도 정확하고 효율적인 통화 분할 및 주제 추출 방법을 제공하므로 다양한 도메인에 적용 가능한 다용도 접근 방식입니다. 우리의 알고리즘은 Dynamics 365 Sales Conversation Intelligence에서 실제로 운영 중이며, 본 연구는 다양한 Dynamics 365 Sales 테넌트에서 수집된 실제 영업 대화를 기반으로 합니다.
English
Transcriptions of phone calls are of significant value across diverse fields, such as sales, customer service, healthcare, and law enforcement. Nevertheless, the analysis of these recorded conversations can be an arduous and time-intensive process, especially when dealing with extended or multifaceted dialogues. In this work, we propose a novel method, GPT-distilled Calls Segmentation and Tagging (GPT-Calls), for efficient and accurate call segmentation and topic extraction. GPT-Calls is composed of offline and online phases. The offline phase is applied once to a given list of topics and involves generating a distribution of synthetic sentences for each topic using a GPT model and extracting anchor vectors. The online phase is applied to every call separately and scores the similarity between the transcripted conversation and the topic anchors found in the offline phase. Then, time domain analysis is applied to the similarity scores to group utterances into segments and tag them with topics. The proposed paradigm provides an accurate and efficient method for call segmentation and topic extraction that does not require labeled data, thus making it a versatile approach applicable to various domains. Our algorithm operates in production under Dynamics 365 Sales Conversation Intelligence, and our research is based on real sales conversations gathered from various Dynamics 365 Sales tenants.
PDF30December 15, 2024