ChatPaper.aiChatPaper

Misurare i Valori Umani e dell'Intelligenza Artificiale basati sulla Psicometria Generativa con Grandi Modelli Linguistici

Measuring Human and AI Values based on Generative Psychometrics with Large Language Models

September 18, 2024
Autori: Haoran Ye, Yuhang Xie, Yuanyi Ren, Hanjun Fang, Xin Zhang, Guojie Song
cs.AI

Abstract

I valori umani e la loro misurazione sono oggetto di un'indagine interdisciplinare di lunga data. I recenti progressi nell'IA hanno suscitato un rinnovato interesse in questo ambito, con i grandi modelli linguistici (LLM) che emergono sia come strumenti sia come soggetti di misurazione dei valori. Questo lavoro introduce la Psicometria Generativa per i Valori (GPV), un paradigma di misurazione dei valori basato su LLM e guidato dai dati, fondato teoricamente sulle percezioni selettive rivelate dal testo. Iniziamo con il raffinamento di un LLM per una misurazione accurata dei valori a livello di percezione e la verifica della capacità dei LLM di analizzare i testi in percezioni, che costituiscono il nucleo del processo GPV. Applicando GPV a blog scritti da esseri umani, dimostriamo la sua stabilità, validità e superiorità rispetto agli strumenti psicologici precedenti. Successivamente, estendendo GPV alla misurazione dei valori tramite LLM, avanziamo l'attuale stato dell'arte con 1) una metodologia psicometrica che misura i valori dei LLM in base alle loro uscite scalabili e libere, consentendo una misurazione specifica del contesto; 2) un'analisi comparativa dei paradigmi di misurazione, indicando i bias di risposta dei metodi precedenti; e 3) un tentativo di collegare i valori dei LLM alla loro sicurezza, rivelando il potere predittivo dei diversi sistemi di valori e gli impatti dei vari valori sulla sicurezza dei LLM. Attraverso sforzi interdisciplinari, miriamo a sfruttare l'IA per la psicometria di prossima generazione e la psicometria per un'IA allineata ai valori.
English
Human values and their measurement are long-standing interdisciplinary inquiry. Recent advances in AI have sparked renewed interest in this area, with large language models (LLMs) emerging as both tools and subjects of value measurement. This work introduces Generative Psychometrics for Values (GPV), an LLM-based, data-driven value measurement paradigm, theoretically grounded in text-revealed selective perceptions. We begin by fine-tuning an LLM for accurate perception-level value measurement and verifying the capability of LLMs to parse texts into perceptions, forming the core of the GPV pipeline. Applying GPV to human-authored blogs, we demonstrate its stability, validity, and superiority over prior psychological tools. Then, extending GPV to LLM value measurement, we advance the current art with 1) a psychometric methodology that measures LLM values based on their scalable and free-form outputs, enabling context-specific measurement; 2) a comparative analysis of measurement paradigms, indicating response biases of prior methods; and 3) an attempt to bridge LLM values and their safety, revealing the predictive power of different value systems and the impacts of various values on LLM safety. Through interdisciplinary efforts, we aim to leverage AI for next-generation psychometrics and psychometrics for value-aligned AI.

Summary

AI-Generated Summary

PDF12November 16, 2024