Thanos: Aprimorando Agentes Conversacionais com Modelo de Linguagem Grande Infundido com Habilidade Mental
Thanos: Enhancing Conversational Agents with Skill-of-Mind-Infused Large Language Model
November 7, 2024
Autores: Young-Jun Lee, Dokyong Lee, Junyoung Youn, Kyeongjin Oh, Ho-Jin Choi
cs.AI
Resumo
Para aumentar o vínculo social com os interlocutores, os seres humanos adquirem naturalmente a capacidade de responder adequadamente em uma determinada situação, considerando qual habilidade conversacional é mais adequada para a resposta - um processo que denominamos "skill-of-mind" (habilidade mental). Para agentes conversacionais baseados em modelos de linguagem de grande porte (LLMs), planejar habilidades conversacionais apropriadas, como os humanos fazem, é um desafio devido à complexidade do diálogo social, especialmente em cenários interativos. Para resolver isso, propomos um conjunto de dados de conversas anotadas com skill-of-mind, denominado Multifaceted Skill-of-Mind, que inclui habilidades conversacionais multifacetadas e com múltiplos turnos em vários cenários interativos (por exemplo, de longo prazo, de aconselhamento, orientados a tarefas), fundamentados em diversos contextos sociais (por exemplo, dados demográficos, persona, regras práticas). Este conjunto de dados consiste em aproximadamente 100 mil conversas. Utilizando este conjunto de dados, introduzimos uma nova família de LLMs infundidos com skill-of-mind, denominada Thanos, com tamanhos de modelo de 1B, 3B e 8B de parâmetros. Por meio de extensos experimentos, esses modelos demonstram com sucesso o processo de skill-of-mind e exibem forte generalização na inferência de habilidades multifacetadas em uma variedade de domínios. Além disso, mostramos que o Thanos melhora significativamente a qualidade das respostas geradas por agentes conversacionais baseados em LLM e promove comportamentos pró-sociais em avaliações humanas.
English
To increase social bonding with interlocutors, humans naturally acquire the
ability to respond appropriately in a given situation by considering which
conversational skill is most suitable for the response - a process we call
skill-of-mind. For large language model (LLM)-based conversational agents,
planning appropriate conversational skills, as humans do, is challenging due to
the complexity of social dialogue, especially in interactive scenarios. To
address this, we propose a skill-of-mind-annotated conversation dataset, named
Multifaceted Skill-of-Mind, which includes multi-turn and multifaceted
conversational skills across various interactive scenarios (e.g., long-term,
counseling, task-oriented), grounded in diverse social contexts (e.g.,
demographics, persona, rules of thumb). This dataset consists of roughly 100K
conversations. Using this dataset, we introduce a new family of
skill-of-mind-infused LLMs, named Thanos, with model sizes of 1B, 3B, and 8B
parameters. With extensive experiments, these models successfully demonstrate
the skill-of-mind process and exhibit strong generalizability in inferring
multifaceted skills across a variety of domains. Moreover, we show that Thanos
significantly enhances the quality of responses generated by LLM-based
conversational agents and promotes prosocial behavior in human evaluations.