Persoonlijkheidskenmerken in Grote Taalmodellen

Samenvatting

De opkomst van grote taalmodellen (LLM's) heeft een revolutie teweeggebracht in natuurlijke taalverwerking, waardoor het mogelijk is om samenhangende en contextueel relevante tekst te genereren. Naarmate LLM's steeds vaker worden ingezet voor conversatie-agents, trekt de gesynthetiseerde persoonlijkheid die in deze modellen is ingebed door hun training op grote hoeveelheden door mensen gegenereerde data de aandacht. Aangezien persoonlijkheid een belangrijke factor is die de effectiviteit van communicatie bepaalt, presenteren we een uitgebreide methode voor het afnemen van gevalideerde psychometrische tests en het kwantificeren, analyseren en vormgeven van persoonlijkheidskenmerken die worden getoond in tekst die wordt gegenereerd door veelgebruikte LLM's. We constateren dat: 1) de persoonlijkheid die wordt gesimuleerd in de uitvoer van sommige LLM's (onder specifieke promptconfiguraties) betrouwbaar en valide is; 2) het bewijs voor de betrouwbaarheid en validiteit van door LLM's gesimuleerde persoonlijkheid sterker is voor grotere en instructie-fijn afgestemde modellen; en 3) de persoonlijkheid in LLM-uitvoer kan worden gevormd langs gewenste dimensies om specifieke persoonlijkheidsprofielen na te bootsen. We bespreken ook potentiële toepassingen en ethische implicaties van ons meet- en vormgevingskader, met name met betrekking tot het verantwoord gebruik van LLM's.

English

The advent of large language models (LLMs) has revolutionized natural language processing, enabling the generation of coherent and contextually relevant text. As LLMs increasingly power conversational agents, the synthesized personality embedded in these models by virtue of their training on large amounts of human-generated data draws attention. Since personality is an important factor determining the effectiveness of communication, we present a comprehensive method for administering validated psychometric tests and quantifying, analyzing, and shaping personality traits exhibited in text generated from widely-used LLMs. We find that: 1) personality simulated in the outputs of some LLMs (under specific prompting configurations) is reliable and valid; 2) evidence of reliability and validity of LLM-simulated personality is stronger for larger and instruction fine-tuned models; and 3) personality in LLM outputs can be shaped along desired dimensions to mimic specific personality profiles. We also discuss potential applications and ethical implications of our measurement and shaping framework, especially regarding responsible use of LLMs.

Persoonlijkheidskenmerken in Grote Taalmodellen

Personality Traits in Large Language Models

Samenvatting

Support