ChatPaper.aiChatPaper

Thanos: Verbetering van Conversatie-Agenten met een Grote Taal-Model Geïnfuseerd met Theory of Mind

Thanos: Enhancing Conversational Agents with Skill-of-Mind-Infused Large Language Model

November 7, 2024
Auteurs: Young-Jun Lee, Dokyong Lee, Junyoung Youn, Kyeongjin Oh, Ho-Jin Choi
cs.AI

Samenvatting

Om de sociale binding met gesprekspartners te vergroten, verwerven mensen van nature het vermogen om gepast te reageren in een gegeven situatie door te overwegen welke gespreksvaardigheid het meest geschikt is voor de reactie – een proces dat we 'skill-of-mind' noemen. Voor op grote taalmodellen (LLM) gebaseerde gespreksagentschappen is het plannen van passende gespreksvaardigheden, zoals mensen doen, een uitdaging vanwege de complexiteit van sociale dialoog, vooral in interactieve scenario's. Om dit aan te pakken, stellen we een met 'skill-of-mind' geannoteerde gespreksdataset voor, genaamd Multifaceted Skill-of-Mind, die meerdere gesprekswendingen en veelzijdige gespreksvaardigheden omvat in diverse interactieve scenario's (bijv. langdurige gesprekken, counseling, taakgerichte gesprekken), verankerd in uiteenlopende sociale contexten (bijv. demografie, persona, vuistregels). Deze dataset bestaat uit ongeveer 100.000 gesprekken. Met behulp van deze dataset introduceren we een nieuwe familie van 'skill-of-mind'-geïnfuseerde LLM's, genaamd Thanos, met modelgroottes van 1B, 3B en 8B parameters. Uitgebreide experimenten tonen aan dat deze modellen met succes het 'skill-of-mind'-proces demonstreren en sterke generaliseerbaarheid vertonen bij het afleiden van veelzijdige vaardigheden in uiteenlopende domeinen. Bovendien laten we zien dat Thanos de kwaliteit van de door LLM-gebaseerde gespreksagentschappen gegenereerde reacties aanzienlijk verbetert en prosociaal gedrag bevordert in humane evaluaties.
English
To increase social bonding with interlocutors, humans naturally acquire the ability to respond appropriately in a given situation by considering which conversational skill is most suitable for the response - a process we call skill-of-mind. For large language model (LLM)-based conversational agents, planning appropriate conversational skills, as humans do, is challenging due to the complexity of social dialogue, especially in interactive scenarios. To address this, we propose a skill-of-mind-annotated conversation dataset, named Multifaceted Skill-of-Mind, which includes multi-turn and multifaceted conversational skills across various interactive scenarios (e.g., long-term, counseling, task-oriented), grounded in diverse social contexts (e.g., demographics, persona, rules of thumb). This dataset consists of roughly 100K conversations. Using this dataset, we introduce a new family of skill-of-mind-infused LLMs, named Thanos, with model sizes of 1B, 3B, and 8B parameters. With extensive experiments, these models successfully demonstrate the skill-of-mind process and exhibit strong generalizability in inferring multifaceted skills across a variety of domains. Moreover, we show that Thanos significantly enhances the quality of responses generated by LLM-based conversational agents and promotes prosocial behavior in human evaluations.
PDF233December 4, 2025