Thanos: Aprimorando Agentes Conversacionais com Modelo de Linguagem Grande Infundido com Habilidade Mental

Resumo

Para aumentar o vínculo social com os interlocutores, os seres humanos adquirem naturalmente a capacidade de responder adequadamente em uma determinada situação, considerando qual habilidade conversacional é mais adequada para a resposta - um processo que denominamos "skill-of-mind" (habilidade mental). Para agentes conversacionais baseados em modelos de linguagem de grande porte (LLMs), planejar habilidades conversacionais apropriadas, como os humanos fazem, é um desafio devido à complexidade do diálogo social, especialmente em cenários interativos. Para resolver isso, propomos um conjunto de dados de conversas anotadas com skill-of-mind, denominado Multifaceted Skill-of-Mind, que inclui habilidades conversacionais multifacetadas e com múltiplos turnos em vários cenários interativos (por exemplo, de longo prazo, de aconselhamento, orientados a tarefas), fundamentados em diversos contextos sociais (por exemplo, dados demográficos, persona, regras práticas). Este conjunto de dados consiste em aproximadamente 100 mil conversas. Utilizando este conjunto de dados, introduzimos uma nova família de LLMs infundidos com skill-of-mind, denominada Thanos, com tamanhos de modelo de 1B, 3B e 8B de parâmetros. Por meio de extensos experimentos, esses modelos demonstram com sucesso o processo de skill-of-mind e exibem forte generalização na inferência de habilidades multifacetadas em uma variedade de domínios. Além disso, mostramos que o Thanos melhora significativamente a qualidade das respostas geradas por agentes conversacionais baseados em LLM e promove comportamentos pró-sociais em avaliações humanas.

English

To increase social bonding with interlocutors, humans naturally acquire the ability to respond appropriately in a given situation by considering which conversational skill is most suitable for the response - a process we call skill-of-mind. For large language model (LLM)-based conversational agents, planning appropriate conversational skills, as humans do, is challenging due to the complexity of social dialogue, especially in interactive scenarios. To address this, we propose a skill-of-mind-annotated conversation dataset, named Multifaceted Skill-of-Mind, which includes multi-turn and multifaceted conversational skills across various interactive scenarios (e.g., long-term, counseling, task-oriented), grounded in diverse social contexts (e.g., demographics, persona, rules of thumb). This dataset consists of roughly 100K conversations. Using this dataset, we introduce a new family of skill-of-mind-infused LLMs, named Thanos, with model sizes of 1B, 3B, and 8B parameters. With extensive experiments, these models successfully demonstrate the skill-of-mind process and exhibit strong generalizability in inferring multifaceted skills across a variety of domains. Moreover, we show that Thanos significantly enhances the quality of responses generated by LLM-based conversational agents and promotes prosocial behavior in human evaluations.

Thanos: Aprimorando Agentes Conversacionais com Modelo de Linguagem Grande Infundido com Habilidade Mental

Thanos: Enhancing Conversational Agents with Skill-of-Mind-Infused Large Language Model

Resumo

Support