ChatPaper.aiChatPaper

Stylebreeder: 텍스트-이미지 모델을 통한 예술적 스타일 탐색 및 대중화

Stylebreeder: Exploring and Democratizing Artistic Styles through Text-to-Image Models

June 20, 2024
저자: Matthew Zheng, Enis Simsar, Hidir Yesiltepe, Federico Tombari, Joel Simon, Pinar Yanardag
cs.AI

초록

텍스트-이미지 모델은 디지털 아트 창작의 지형을 혁신하며, 매우 세밀하고 창의적인 시각적 콘텐츠 생성을 가능하게 함으로써 점점 더 인기를 얻고 있습니다. 이러한 모델은 특히 아트 생성 분야에서 널리 활용되며, 다양한 창의적 표현을 촉진하고 예술 창작에 대한 접근성을 민주화하고 있습니다. 본 논문에서는 1,300만 명 이상의 사용자를 보유한 창의적 탐구의 주요 허브로 부상한 Artbreeder 플랫폼에서 95,000명의 사용자가 생성한 680만 개의 이미지와 180만 개의 프롬프트로 구성된 STYLEBREEDER 데이터셋을 소개합니다. 이 데이터셋을 활용하여 다양한 예술 스타일을 식별하고, 개인화된 콘텐츠를 생성하며, 사용자의 관심사에 기반한 스타일을 추천하는 일련의 작업을 제안합니다. '사이버펑크'나 '피카소'와 같은 전통적인 범주를 초월한 독특한 사용자 생성 스타일을 문서화함으로써, 전 세계 사용자들의 집단적 창의적 심리를 깊이 있게 이해할 수 있는 잠재력을 탐구합니다. 또한 예술적 표현을 강화하기 위해 다양한 개인화 방법을 평가하고, LoRA 형식으로 공개 사용 가능한 스타일 아틀라스를 소개합니다. 우리의 연구는 텍스트-이미지 확산 모델이 독특한 예술적 표현을 발견하고 촉진할 수 있는 잠재력을 입증하며, 예술 분야에서 AI의 민주화를 더욱 촉진하고 더 다양하고 포용적인 예술 커뮤니티를 조성합니다. 데이터셋, 코드 및 모델은 Public Domain (CC0) 라이선스 하에 https://stylebreeder.github.io에서 이용 가능합니다.
English
Text-to-image models are becoming increasingly popular, revolutionizing the landscape of digital art creation by enabling highly detailed and creative visual content generation. These models have been widely employed across various domains, particularly in art generation, where they facilitate a broad spectrum of creative expression and democratize access to artistic creation. In this paper, we introduce STYLEBREEDER, a comprehensive dataset of 6.8M images and 1.8M prompts generated by 95K users on Artbreeder, a platform that has emerged as a significant hub for creative exploration with over 13M users. We introduce a series of tasks with this dataset aimed at identifying diverse artistic styles, generating personalized content, and recommending styles based on user interests. By documenting unique, user-generated styles that transcend conventional categories like 'cyberpunk' or 'Picasso,' we explore the potential for unique, crowd-sourced styles that could provide deep insights into the collective creative psyche of users worldwide. We also evaluate different personalization methods to enhance artistic expression and introduce a style atlas, making these models available in LoRA format for public use. Our research demonstrates the potential of text-to-image diffusion models to uncover and promote unique artistic expressions, further democratizing AI in art and fostering a more diverse and inclusive artistic community. The dataset, code and models are available at https://stylebreeder.github.io under a Public Domain (CC0) license.

Summary

AI-Generated Summary

PDF172November 29, 2024