PRISM: Apprendimento della Conoscenza Progettuale dai Dati per il Miglioramento Progettuale Stilistico
PRISM: Learning Design Knowledge from Data for Stylistic Design Improvement
January 16, 2026
Autori: Huaxiaoyue Wang, Sunav Choudhary, Franck Dernoncourt, Yu Shen, Stefano Petrangeli
cs.AI
Abstract
La progettazione grafica comporta spesso l'esplorazione di diverse direzioni stilistiche, un processo che può risultare dispendioso in termini di tempo per i non esperti. Affrontiamo questo problema di miglioramento stilistico dei progetti basato su istruzioni in linguaggio naturale. Sebbene i VLM abbiano dimostrato un iniziale successo nella progettazione grafica, la loro conoscenza pre-addestrata sugli stili è spesso troppo generica e disallineata rispetto ai dati specifici del dominio. Ad esempio, i VLM potrebbero associare il minimalismo a design astratti, mentre i progettisti enfatizzano le scelte di forme e colori. La nostra intuizione chiave è sfruttare i dati di design – una raccolta di progetti del mondo reale che catturano implicitamente i principi dei designer – per apprendere la conoscenza del design e guidare il miglioramento stilistico. Proponiamo PRISM (PRior-Informed Stylistic Modification), che costruisce e applica una base di conoscenza del design attraverso tre fasi: (1) clustering di progetti ad alta varianza per catturare la diversità all'interno di uno stile, (2) sintesi di ogni cluster in conoscenze di design attuabili e (3) recupero della conoscenza rilevante durante l'inferenza per consentire un miglioramento consapevole dello stile. Esperimenti sul dataset Crello mostrano che PRISM raggiunge il rango medio più alto di 1.49 (dove un valore più vicino a 1 è migliore) rispetto ai baseline nell'allineamento stilistico. Studi utente convalidano ulteriormente questi risultati, dimostrando che PRISM è costantemente preferito dai designer.
English
Graphic design often involves exploring different stylistic directions, which can be time-consuming for non-experts. We address this problem of stylistically improving designs based on natural language instructions. While VLMs have shown initial success in graphic design, their pretrained knowledge on styles is often too general and misaligned with specific domain data. For example, VLMs may associate minimalism with abstract designs, whereas designers emphasize shape and color choices. Our key insight is to leverage design data -- a collection of real-world designs that implicitly capture designer's principles -- to learn design knowledge and guide stylistic improvement. We propose PRISM (PRior-Informed Stylistic Modification) that constructs and applies a design knowledge base through three stages: (1) clustering high-variance designs to capture diversity within a style, (2) summarizing each cluster into actionable design knowledge, and (3) retrieving relevant knowledge during inference to enable style-aware improvement. Experiments on the Crello dataset show that PRISM achieves the highest average rank of 1.49 (closer to 1 is better) over baselines in style alignment. User studies further validate these results, showing that PRISM is consistently preferred by designers.