Танос: Улучшение диалоговых агентов с помощью больших языковых моделей, обогащенных навыками мышления
Thanos: Enhancing Conversational Agents with Skill-of-Mind-Infused Large Language Model
November 7, 2024
Авторы: Young-Jun Lee, Dokyong Lee, Junyoung Youn, Kyeongjin Oh, Ho-Jin Choi
cs.AI
Аннотация
Для повышения социальной связанности с собеседниками люди естественным образом приобретают способность реагировать уместно в конкретной ситуации, оценивая, какой коммуникативный навык наиболее подходит для ответа — процесс, который мы называем "навыком мышления" (skill-of-mind). Для диалоговых агентов на основе больших языковых моделей (LLM) планирование соответствующих коммуникативных навыков, как это делают люди, является сложной задачей из-за сложности социального диалога, особенно в интерактивных сценариях. Для решения этой проблемы мы предлагаем размеченный диалоговый набор данных с аннотацией навыков мышления, названный Multifaceted Skill-of-Mind, который включает многоходовые и многогранные коммуникативные навыки в различных интерактивных сценариях (например, долгосрочные, консультационные, целеориентированные), основанные на разнообразных социальных контекстах (демография, персона, практические правила). Этот набор данных содержит примерно 100 тыс. диалогов. Используя его, мы представляем новое семейство LLM, обогащенных навыками мышления, под названием Thanos, с размерами моделей 1 млрд, 3 млрд и 8 млрд параметров. Многочисленные эксперименты показывают, что эти модели успешно демонстрируют процесс навыков мышления и обладают высокой способностью к обобщению при выводе многогранных навыков в различных областях. Кроме того, мы показываем, что Thanos значительно повышает качество ответов, генерируемых LLM-агентами, и способствует просоциальному поведению по оценкам людей.
English
To increase social bonding with interlocutors, humans naturally acquire the
ability to respond appropriately in a given situation by considering which
conversational skill is most suitable for the response - a process we call
skill-of-mind. For large language model (LLM)-based conversational agents,
planning appropriate conversational skills, as humans do, is challenging due to
the complexity of social dialogue, especially in interactive scenarios. To
address this, we propose a skill-of-mind-annotated conversation dataset, named
Multifaceted Skill-of-Mind, which includes multi-turn and multifaceted
conversational skills across various interactive scenarios (e.g., long-term,
counseling, task-oriented), grounded in diverse social contexts (e.g.,
demographics, persona, rules of thumb). This dataset consists of roughly 100K
conversations. Using this dataset, we introduce a new family of
skill-of-mind-infused LLMs, named Thanos, with model sizes of 1B, 3B, and 8B
parameters. With extensive experiments, these models successfully demonstrate
the skill-of-mind process and exhibit strong generalizability in inferring
multifaceted skills across a variety of domains. Moreover, we show that Thanos
significantly enhances the quality of responses generated by LLM-based
conversational agents and promotes prosocial behavior in human evaluations.