ChatPaper.aiChatPaper

Allineamento Estetico Rischia l'Assimilazione: Come la Generazione di Immagini e i Modelli di Ricompra Rinforzano i Pregiudizi Estetici e la "Censura" Ideologica

Aesthetic Alignment Risks Assimilation: How Image Generation and Reward Models Reinforce Beauty Bias and Ideological "Censorship"

December 9, 2025
Autori: Wenqi Marshall Guo, Qingyun Qian, Khalad Hasan, Shan Du
cs.AI

Abstract

L'allineamento eccessivo dei modelli di generazione di immagini a una preferenza estetica generalizzata entra in conflitto con l'intento dell'utente, in particolare quando vengono richiesti output "anti-estetici" per scopi artistici o critici. Questa aderenza privilegia valori centrati sullo sviluppatore, compromettendo l'autonomia dell'utente e il pluralismo estetico. Testiamo questo pregiudizio costruendo un dataset estetico a largo spettro e valutando modelli all'avanguardia per la generazione e la ricompensa. Scopriamo che i modelli di generazione allineati all'estetica ricadono frequentemente in output convenzionalmente belli, non riuscendo a rispettare le istruzioni per immagini di bassa qualità o negative. Crucialmente, i modelli di ricompensa penalizzano le immagini anti-estetiche anche quando corrispondono perfettamente al prompt esplicito dell'utente. Confermiamo questo bias sistemico attraverso l'editing immagine-immagine e la valutazione rispetto a opere d'arte astratte reali.
English
Over-aligning image generation models to a generalized aesthetic preference conflicts with user intent, particularly when ``anti-aesthetic" outputs are requested for artistic or critical purposes. This adherence prioritizes developer-centered values, compromising user autonomy and aesthetic pluralism. We test this bias by constructing a wide-spectrum aesthetics dataset and evaluating state-of-the-art generation and reward models. We find that aesthetic-aligned generation models frequently default to conventionally beautiful outputs, failing to respect instructions for low-quality or negative imagery. Crucially, reward models penalize anti-aesthetic images even when they perfectly match the explicit user prompt. We confirm this systemic bias through image-to-image editing and evaluation against real abstract artworks.
PDF62December 19, 2025