Thanos: Verbesserung von Konversationsagenten durch Large Language Models mit integrierter Skill-of-Mind-Funktionalität
Thanos: Enhancing Conversational Agents with Skill-of-Mind-Infused Large Language Model
November 7, 2024
papers.authors: Young-Jun Lee, Dokyong Lee, Junyoung Youn, Kyeongjin Oh, Ho-Jin Choi
cs.AI
papers.abstract
Um die soziale Bindung zu Gesprächspartnern zu stärken, erwerben Menschen natürlicherweise die Fähigkeit, angemessen auf eine gegebene Situation zu reagieren, indem sie überlegen, welche Gesprächsfähigkeit für die Antwort am besten geeignet ist – einen Prozess, den wir als „Skill-of-Mind“ bezeichnen. Für konversationsbasierte Agenten, die auf großen Sprachmodellen (LLMs) basieren, ist die Planung geeigneter Gesprächsfähigkeiten, wie es Menschen tun, aufgrund der Komplexität sozialer Dialoge, insbesondere in interaktiven Szenarien, eine Herausforderung. Um dies zu adressieren, schlagen wir einen mit „Skill-of-Mind“ annotierten Konversationsdatensatz vor, genannt „Multifaceted Skill-of-Mind“, der mehrstufige und vielseitige Gesprächsfähigkeiten in verschiedenen interaktiven Szenarien (z. B. langfristig, beratend, aufgabenorientiert) umfasst, die in diversen sozialen Kontexten (z. B. Demografie, Persona, Faustregeln) verankert sind. Dieser Datensatz besteht aus etwa 100.000 Konversationen. Mit diesem Datensatz führen wir eine neue Familie von „Skill-of-Mind“-infundierten LLMs ein, genannt „Thanos“, mit Modellgrößen von 1B, 3B und 8B Parametern. Durch umfangreiche Experimente demonstrieren diese Modelle erfolgreich den „Skill-of-Mind“-Prozess und zeigen eine starke Generalisierbarkeit bei der Inferenz vielseitiger Fähigkeiten über eine Vielzahl von Domänen hinweg. Darüber hinaus zeigen wir, dass Thanos die Qualität der von LLM-basierten Konversationsagenten generierten Antworten signifikant verbessert und prosoziales Verhalten in menschlichen Bewertungen fördert.
English
To increase social bonding with interlocutors, humans naturally acquire the
ability to respond appropriately in a given situation by considering which
conversational skill is most suitable for the response - a process we call
skill-of-mind. For large language model (LLM)-based conversational agents,
planning appropriate conversational skills, as humans do, is challenging due to
the complexity of social dialogue, especially in interactive scenarios. To
address this, we propose a skill-of-mind-annotated conversation dataset, named
Multifaceted Skill-of-Mind, which includes multi-turn and multifaceted
conversational skills across various interactive scenarios (e.g., long-term,
counseling, task-oriented), grounded in diverse social contexts (e.g.,
demographics, persona, rules of thumb). This dataset consists of roughly 100K
conversations. Using this dataset, we introduce a new family of
skill-of-mind-infused LLMs, named Thanos, with model sizes of 1B, 3B, and 8B
parameters. With extensive experiments, these models successfully demonstrate
the skill-of-mind process and exhibit strong generalizability in inferring
multifaceted skills across a variety of domains. Moreover, we show that Thanos
significantly enhances the quality of responses generated by LLM-based
conversational agents and promotes prosocial behavior in human evaluations.