Thanos: Mejorando Agentes Conversacionales con Modelos de Lenguaje Grande Infundidos con Habilidad Mental
Thanos: Enhancing Conversational Agents with Skill-of-Mind-Infused Large Language Model
November 7, 2024
Autores: Young-Jun Lee, Dokyong Lee, Junyoung Youn, Kyeongjin Oh, Ho-Jin Choi
cs.AI
Resumen
Para fortalecer los vínculos sociales con los interlocutores, los seres humanos adquieren naturalmente la capacidad de responder adecuadamente en una situación determinada, evaluando qué habilidad conversacional es la más apropiada para la respuesta, un proceso que denominamos *skill-of-mind* (habilidad mental). Para los agentes conversacionales basados en modelos de lenguaje grandes (LLM), planificar habilidades conversacionales apropiadas, como lo hacen los humanos, es un desafío debido a la complejidad del diálogo social, especialmente en escenarios interactivos. Para abordar esto, proponemos un conjunto de datos de conversaciones anotadas con *skill-of-mind*, denominado **Multifaceted Skill-of-Mind** (Habilidad Mental Multifacética), que incluye habilidades conversacionales multiturno y multifacéticas en diversos escenarios interactivos (por ejemplo, a largo plazo, de asesoramiento, orientados a tareas), fundamentadas en contextos sociales variados (por ejemplo, datos demográficos, personajes, reglas prácticas). Este conjunto de datos consta de aproximadamente 100.000 conversaciones. Utilizando este conjunto de datos, presentamos una nueva familia de LLM infundidos con *skill-of-mind*, llamada **Thanos**, con tamaños de modelo de 1B, 3B y 8B de parámetros. Mediante experimentos exhaustivos, estos modelos demuestran exitosamente el proceso de *skill-of-mind* y exhiben una fuerte capacidad de generalización para inferir habilidades multifacéticas en una variedad de dominios. Además, mostramos que Thanos mejora significativamente la calidad de las respuestas generadas por los agentes conversacionales basados en LLM y fomenta comportamientos prosociales en evaluaciones humanas.
English
To increase social bonding with interlocutors, humans naturally acquire the
ability to respond appropriately in a given situation by considering which
conversational skill is most suitable for the response - a process we call
skill-of-mind. For large language model (LLM)-based conversational agents,
planning appropriate conversational skills, as humans do, is challenging due to
the complexity of social dialogue, especially in interactive scenarios. To
address this, we propose a skill-of-mind-annotated conversation dataset, named
Multifaceted Skill-of-Mind, which includes multi-turn and multifaceted
conversational skills across various interactive scenarios (e.g., long-term,
counseling, task-oriented), grounded in diverse social contexts (e.g.,
demographics, persona, rules of thumb). This dataset consists of roughly 100K
conversations. Using this dataset, we introduce a new family of
skill-of-mind-infused LLMs, named Thanos, with model sizes of 1B, 3B, and 8B
parameters. With extensive experiments, these models successfully demonstrate
the skill-of-mind process and exhibit strong generalizability in inferring
multifaceted skills across a variety of domains. Moreover, we show that Thanos
significantly enhances the quality of responses generated by LLM-based
conversational agents and promotes prosocial behavior in human evaluations.