Thanos: Mejorando Agentes Conversacionales con Modelos de Lenguaje Grande Infundidos con Habilidad Mental

Resumen

Para fortalecer los vínculos sociales con los interlocutores, los seres humanos adquieren naturalmente la capacidad de responder adecuadamente en una situación determinada, evaluando qué habilidad conversacional es la más apropiada para la respuesta, un proceso que denominamos *skill-of-mind* (habilidad mental). Para los agentes conversacionales basados en modelos de lenguaje grandes (LLM), planificar habilidades conversacionales apropiadas, como lo hacen los humanos, es un desafío debido a la complejidad del diálogo social, especialmente en escenarios interactivos. Para abordar esto, proponemos un conjunto de datos de conversaciones anotadas con *skill-of-mind*, denominado **Multifaceted Skill-of-Mind** (Habilidad Mental Multifacética), que incluye habilidades conversacionales multiturno y multifacéticas en diversos escenarios interactivos (por ejemplo, a largo plazo, de asesoramiento, orientados a tareas), fundamentadas en contextos sociales variados (por ejemplo, datos demográficos, personajes, reglas prácticas). Este conjunto de datos consta de aproximadamente 100.000 conversaciones. Utilizando este conjunto de datos, presentamos una nueva familia de LLM infundidos con *skill-of-mind*, llamada **Thanos**, con tamaños de modelo de 1B, 3B y 8B de parámetros. Mediante experimentos exhaustivos, estos modelos demuestran exitosamente el proceso de *skill-of-mind* y exhiben una fuerte capacidad de generalización para inferir habilidades multifacéticas en una variedad de dominios. Además, mostramos que Thanos mejora significativamente la calidad de las respuestas generadas por los agentes conversacionales basados en LLM y fomenta comportamientos prosociales en evaluaciones humanas.

English

To increase social bonding with interlocutors, humans naturally acquire the ability to respond appropriately in a given situation by considering which conversational skill is most suitable for the response - a process we call skill-of-mind. For large language model (LLM)-based conversational agents, planning appropriate conversational skills, as humans do, is challenging due to the complexity of social dialogue, especially in interactive scenarios. To address this, we propose a skill-of-mind-annotated conversation dataset, named Multifaceted Skill-of-Mind, which includes multi-turn and multifaceted conversational skills across various interactive scenarios (e.g., long-term, counseling, task-oriented), grounded in diverse social contexts (e.g., demographics, persona, rules of thumb). This dataset consists of roughly 100K conversations. Using this dataset, we introduce a new family of skill-of-mind-infused LLMs, named Thanos, with model sizes of 1B, 3B, and 8B parameters. With extensive experiments, these models successfully demonstrate the skill-of-mind process and exhibit strong generalizability in inferring multifaceted skills across a variety of domains. Moreover, we show that Thanos significantly enhances the quality of responses generated by LLM-based conversational agents and promotes prosocial behavior in human evaluations.

Thanos: Mejorando Agentes Conversacionales con Modelos de Lenguaje Grande Infundidos con Habilidad Mental

Thanos: Enhancing Conversational Agents with Skill-of-Mind-Infused Large Language Model

Resumen

Support