피어 랭크 정밀도: DataSeeds의 주석 처리된 이미지에서 비전 모델 미세 조정을 위한 기초 데이터셋 구축
Peer-Ranked Precision: Creating a Foundational Dataset for Fine-Tuning Vision Models from DataSeeds' Annotated Imagery
June 6, 2025
저자: Sajjad Abdoli, Freeman Lewin, Gediminas Vasiliauskas, Fabian Schonholz
cs.AI
초록
현대 인공지능(AI) 모델, 특히 컴퓨터 비전 및 이미지 생성 작업에 활용되는 확산 기반 모델의 개발은 방법론 측면에서 패러다임 전환을 겪고 있습니다. 기존에는 복잡한 모델 아키텍처와 하이퍼파라미터 최적화를 통해 성능 향상을 추구하는 "모델 중심" 접근법이 주를 이루었으나, 이제는 더욱 세밀한 "데이터 중심" 접근법이 주목받고 있습니다. 이 새로운 프레임워크는 모델 성능의 주요 동인으로서 훈련 데이터의 품질, 구조, 관련성을 강조합니다. 이러한 패러다임 전환을 실현하기 위해, 우리는 약 10,610장의 고품질 인간 평가 사진 이미지와 다층적 주석으로 구성된 DataSeeds.AI 샘플 데이터셋("DSD")을 소개합니다. DSD는 상업용 이미지 데이터셋의 새로운 표준을 제시하기 위해 설계된 기초 컴퓨터 비전 데이터셋입니다. DataSeed.AI의 1억 장 이상의 이미지 카탈로그 중 일부를 대표하는 DSD는 강력한 상업적 및 다중모달 AI 개발에 필요한 확장 가능한 기반을 제공합니다. 이번 심층 탐구적 분석을 통해 우리는 DSD가 특정 모델에서 기존 벤치마크 대비 생성한 정량적 개선 사항을 기록하고, 평가에 사용된 코드와 훈련된 모델을 공개합니다.
English
The development of modern Artificial Intelligence (AI) models, particularly
diffusion-based models employed in computer vision and image generation tasks,
is undergoing a paradigmatic shift in development methodologies. Traditionally
dominated by a "Model Centric" approach, in which performance gains were
primarily pursued through increasingly complex model architectures and
hyperparameter optimization, the field is now recognizing a more nuanced
"Data-Centric" approach. This emergent framework foregrounds the quality,
structure, and relevance of training data as the principal driver of model
performance. To operationalize this paradigm shift, we introduce the
DataSeeds.AI sample dataset (the "DSD"), initially comprised of approximately
10,610 high-quality human peer-ranked photography images accompanied by
extensive multi-tier annotations. The DSD is a foundational computer vision
dataset designed to usher in a new standard for commercial image datasets.
Representing a small fraction of DataSeed.AI's 100 million-plus image catalog,
the DSD provides a scalable foundation necessary for robust commercial and
multimodal AI development. Through this in-depth exploratory analysis, we
document the quantitative improvements generated by the DSD on specific models
against known benchmarks and make the code and the trained models used in our
evaluation publicly available.