Rasgos de Personalidad en Modelos de Lenguaje a Gran Escala
Personality Traits in Large Language Models
July 1, 2023
Autores: Mustafa Safdari, Greg Serapio-García, Clément Crepy, Stephen Fitz, Peter Romero, Luning Sun, Marwa Abdulhai, Aleksandra Faust, Maja Matarić
cs.AI
Resumen
El surgimiento de los modelos de lenguaje de gran escala (LLMs, por sus siglas en inglés) ha revolucionado el procesamiento del lenguaje natural, permitiendo la generación de texto coherente y contextualmente relevante. A medida que los LLMs impulsan cada vez más a los agentes conversacionales, la personalidad sintetizada incorporada en estos modelos, producto de su entrenamiento con grandes cantidades de datos generados por humanos, atrae atención. Dado que la personalidad es un factor importante que determina la efectividad de la comunicación, presentamos un método integral para administrar pruebas psicométricas validadas y cuantificar, analizar y moldear los rasgos de personalidad exhibidos en el texto generado por LLMs ampliamente utilizados. Encontramos que: 1) la personalidad simulada en las salidas de algunos LLMs (bajo configuraciones específicas de indicaciones) es confiable y válida; 2) la evidencia de confiabilidad y validez de la personalidad simulada por LLMs es más fuerte en modelos más grandes y ajustados mediante instrucciones; y 3) la personalidad en las salidas de los LLMs puede moldearse en dimensiones deseadas para imitar perfiles de personalidad específicos. También discutimos las aplicaciones potenciales y las implicaciones éticas de nuestro marco de medición y moldeamiento, especialmente en lo que respecta al uso responsable de los LLMs.
English
The advent of large language models (LLMs) has revolutionized natural
language processing, enabling the generation of coherent and contextually
relevant text. As LLMs increasingly power conversational agents, the
synthesized personality embedded in these models by virtue of their training on
large amounts of human-generated data draws attention. Since personality is an
important factor determining the effectiveness of communication, we present a
comprehensive method for administering validated psychometric tests and
quantifying, analyzing, and shaping personality traits exhibited in text
generated from widely-used LLMs. We find that: 1) personality simulated in the
outputs of some LLMs (under specific prompting configurations) is reliable and
valid; 2) evidence of reliability and validity of LLM-simulated personality is
stronger for larger and instruction fine-tuned models; and 3) personality in
LLM outputs can be shaped along desired dimensions to mimic specific
personality profiles. We also discuss potential applications and ethical
implications of our measurement and shaping framework, especially regarding
responsible use of LLMs.