위버: 창의적 글쓰기를 위한 기초 모델
Weaver: Foundation Models for Creative Writing
January 30, 2024
저자: Tiannan Wang, Jiamin Chen, Qingrui Jia, Shuai Wang, Ruoyu Fang, Huilin Wang, Zhaowei Gao, Chunzhao Xie, Chuou Xu, Jihong Dai, Yibin Liu, Jialong Wu, Shengwei Ding, Long Li, Zhiwei Huang, Xinle Deng, Teng Yu, Gangan Ma, Han Xiao, Zixin Chen, Danjun Xiang, Yunxia Wang, Yuanyuan Zhu, Yi Xiao, Jing Wang, Yiru Wang, Siran Ding, Jiayang Huang, Jiayi Xu, Yilihamu Tayier, Zhenyu Hu, Yuan Gao, Chengfeng Zheng, Yueshu Ye, Yihang Li, Lei Wan, Xinyue Jiang, Yujie Wang, Siyu Cheng, Zhule Song, Xiangru Tang, Xiaohua Xu, Ningyu Zhang, Huajun Chen, Yuchen Eleanor Jiang, Wangchunshu Zhou
cs.AI
초록
본 연구는 콘텐츠 생성에 특화된 대규모 언어 모델(LLM) 패밀리인 Weaver를 소개한다. Weaver는 대규모 언어 모델의 글쓰기 능력을 향상시키기 위해 신중하게 선별된 코퍼스로 사전 학습되었으며, 창의적 및 전문적 글쓰기 목적에 맞춰 미세 조정되었다. 또한, 전문 작가들의 선호도에 맞추기 위해 새로운 명령 데이터 합성 및 LLM 정렬 방법을 적용하여 더욱 인간적인 텍스트를 생성하고 다양한 콘텐츠 생성 지시를 따를 수 있도록 설계되었다. Weaver 패밀리는 Weaver Mini(1.8B), Weaver Base(6B), Weaver Pro(14B), Weaver Ultra(34B) 등 다양한 크기의 모델로 구성되어 있으며, 각각 다른 응용 분야에 적합하다. 또한, 쿼리 복잡도에 따라 라우팅 에이전트가 동적으로 모델을 선택하여 응답 품질과 계산 비용을 균형 있게 조절할 수 있다. LLM의 글쓰기 능력을 평가하기 위해 신중하게 구성된 벤치마크에서 모든 크기의 Weaver 모델이 자신보다 훨씬 큰 일반 목적 LLM을 능가하는 것으로 나타났다. 특히, 가장 강력한 Weaver Ultra 모델은 최첨단 일반 목적 LLM인 GPT-4를 다양한 글쓰기 시나리오에서 능가하며, 글쓰기 목적에 특화된 LLM을 훈련시키는 것의 장점을 입증했다. 또한, Weaver는 기본적으로 검색 증강 생성(RAG) 및 함수 호출(도구 사용)을 지원한다. 이러한 기능을 활용하여 외부 지식 베이스, 도구 또는 API를 통합하고 개인화된 글쓰기 지원을 제공하는 등 AI 지원 글쓰기 시스템을 개선하는 다양한 사용 사례를 제시한다. 더 나아가, 특정 도메인에 맞춘 LLM의 사전 학습 및 미세 조정을 위한 가이드라인과 모범 사례를 논의하고 요약한다.
English
This work introduces Weaver, our first family of large language models (LLMs)
dedicated to content creation. Weaver is pre-trained on a carefully selected
corpus that focuses on improving the writing capabilities of large language
models. We then fine-tune Weaver for creative and professional writing purposes
and align it to the preference of professional writers using a suit of novel
methods for instruction data synthesis and LLM alignment, making it able to
produce more human-like texts and follow more diverse instructions for content
creation. The Weaver family consists of models of Weaver Mini (1.8B), Weaver
Base (6B), Weaver Pro (14B), and Weaver Ultra (34B) sizes, suitable for
different applications and can be dynamically dispatched by a routing agent
according to query complexity to balance response quality and computation cost.
Evaluation on a carefully curated benchmark for assessing the writing
capabilities of LLMs shows Weaver models of all sizes outperform generalist
LLMs several times larger than them. Notably, our most-capable Weaver Ultra
model surpasses GPT-4, a state-of-the-art generalist LLM, on various writing
scenarios, demonstrating the advantage of training specialized LLMs for writing
purposes. Moreover, Weaver natively supports retrieval-augmented generation
(RAG) and function calling (tool usage). We present various use cases of these
abilities for improving AI-assisted writing systems, including integration of
external knowledge bases, tools, or APIs, and providing personalized writing
assistance. Furthermore, we discuss and summarize a guideline and best
practices for pre-training and fine-tuning domain-specific LLMs.