Thanos: Verbesserung von Konversationsagenten durch Large Language Models mit integrierter Skill-of-Mind-Funktionalität

papers.abstract

Um die soziale Bindung zu Gesprächspartnern zu stärken, erwerben Menschen natürlicherweise die Fähigkeit, angemessen auf eine gegebene Situation zu reagieren, indem sie überlegen, welche Gesprächsfähigkeit für die Antwort am besten geeignet ist – einen Prozess, den wir als „Skill-of-Mind“ bezeichnen. Für konversationsbasierte Agenten, die auf großen Sprachmodellen (LLMs) basieren, ist die Planung geeigneter Gesprächsfähigkeiten, wie es Menschen tun, aufgrund der Komplexität sozialer Dialoge, insbesondere in interaktiven Szenarien, eine Herausforderung. Um dies zu adressieren, schlagen wir einen mit „Skill-of-Mind“ annotierten Konversationsdatensatz vor, genannt „Multifaceted Skill-of-Mind“, der mehrstufige und vielseitige Gesprächsfähigkeiten in verschiedenen interaktiven Szenarien (z. B. langfristig, beratend, aufgabenorientiert) umfasst, die in diversen sozialen Kontexten (z. B. Demografie, Persona, Faustregeln) verankert sind. Dieser Datensatz besteht aus etwa 100.000 Konversationen. Mit diesem Datensatz führen wir eine neue Familie von „Skill-of-Mind“-infundierten LLMs ein, genannt „Thanos“, mit Modellgrößen von 1B, 3B und 8B Parametern. Durch umfangreiche Experimente demonstrieren diese Modelle erfolgreich den „Skill-of-Mind“-Prozess und zeigen eine starke Generalisierbarkeit bei der Inferenz vielseitiger Fähigkeiten über eine Vielzahl von Domänen hinweg. Darüber hinaus zeigen wir, dass Thanos die Qualität der von LLM-basierten Konversationsagenten generierten Antworten signifikant verbessert und prosoziales Verhalten in menschlichen Bewertungen fördert.

English

To increase social bonding with interlocutors, humans naturally acquire the ability to respond appropriately in a given situation by considering which conversational skill is most suitable for the response - a process we call skill-of-mind. For large language model (LLM)-based conversational agents, planning appropriate conversational skills, as humans do, is challenging due to the complexity of social dialogue, especially in interactive scenarios. To address this, we propose a skill-of-mind-annotated conversation dataset, named Multifaceted Skill-of-Mind, which includes multi-turn and multifaceted conversational skills across various interactive scenarios (e.g., long-term, counseling, task-oriented), grounded in diverse social contexts (e.g., demographics, persona, rules of thumb). This dataset consists of roughly 100K conversations. Using this dataset, we introduce a new family of skill-of-mind-infused LLMs, named Thanos, with model sizes of 1B, 3B, and 8B parameters. With extensive experiments, these models successfully demonstrate the skill-of-mind process and exhibit strong generalizability in inferring multifaceted skills across a variety of domains. Moreover, we show that Thanos significantly enhances the quality of responses generated by LLM-based conversational agents and promotes prosocial behavior in human evaluations.

Thanos: Verbesserung von Konversationsagenten durch Large Language Models mit integrierter Skill-of-Mind-Funktionalität

Thanos: Enhancing Conversational Agents with Skill-of-Mind-Infused Large Language Model

papers.abstract

Support