ChatPaper.aiChatPaper

Weaver: Modelos Fundamentais para Escrita Criativa

Weaver: Foundation Models for Creative Writing

January 30, 2024
Autores: Tiannan Wang, Jiamin Chen, Qingrui Jia, Shuai Wang, Ruoyu Fang, Huilin Wang, Zhaowei Gao, Chunzhao Xie, Chuou Xu, Jihong Dai, Yibin Liu, Jialong Wu, Shengwei Ding, Long Li, Zhiwei Huang, Xinle Deng, Teng Yu, Gangan Ma, Han Xiao, Zixin Chen, Danjun Xiang, Yunxia Wang, Yuanyuan Zhu, Yi Xiao, Jing Wang, Yiru Wang, Siran Ding, Jiayang Huang, Jiayi Xu, Yilihamu Tayier, Zhenyu Hu, Yuan Gao, Chengfeng Zheng, Yueshu Ye, Yihang Li, Lei Wan, Xinyue Jiang, Yujie Wang, Siyu Cheng, Zhule Song, Xiangru Tang, Xiaohua Xu, Ningyu Zhang, Huajun Chen, Yuchen Eleanor Jiang, Wangchunshu Zhou
cs.AI

Resumo

Este trabalho apresenta o Weaver, nossa primeira família de modelos de linguagem de grande escala (LLMs) dedicada à criação de conteúdo. O Weaver é pré-treinado em um corpus cuidadosamente selecionado que visa aprimorar as capacidades de escrita de modelos de linguagem de grande escala. Em seguida, ajustamos o Weaver para fins de escrita criativa e profissional e o alinhamos às preferências de escritores profissionais utilizando um conjunto de métodos inovadores para síntese de dados de instrução e alinhamento de LLMs, tornando-o capaz de produzir textos mais humanos e seguir instruções mais diversas para a criação de conteúdo. A família Weaver consiste em modelos de tamanhos Weaver Mini (1,8B), Weaver Base (6B), Weaver Pro (14B) e Weaver Ultra (34B), adequados para diferentes aplicações e que podem ser dinamicamente direcionados por um agente de roteamento de acordo com a complexidade da consulta para equilibrar a qualidade da resposta e o custo computacional. A avaliação em um benchmark cuidadosamente elaborado para avaliar as capacidades de escrita de LLMs mostra que os modelos Weaver de todos os tamanhos superam LLMs generalistas várias vezes maiores que eles. Notavelmente, nosso modelo mais capaz, o Weaver Ultra, supera o GPT-4, um LLM generalista de última geração, em vários cenários de escrita, demonstrando a vantagem de treinar LLMs especializados para fins de escrita. Além disso, o Weaver suporta nativamente geração aumentada por recuperação (RAG) e chamada de funções (uso de ferramentas). Apresentamos vários casos de uso dessas capacidades para melhorar sistemas de escrita assistida por IA, incluindo integração de bases de conhecimento externas, ferramentas ou APIs, e fornecimento de assistência de escrita personalizada. Além disso, discutimos e resumimos uma diretriz e melhores práticas para pré-treinamento e ajuste fino de LLMs específicos de domínio.
English
This work introduces Weaver, our first family of large language models (LLMs) dedicated to content creation. Weaver is pre-trained on a carefully selected corpus that focuses on improving the writing capabilities of large language models. We then fine-tune Weaver for creative and professional writing purposes and align it to the preference of professional writers using a suit of novel methods for instruction data synthesis and LLM alignment, making it able to produce more human-like texts and follow more diverse instructions for content creation. The Weaver family consists of models of Weaver Mini (1.8B), Weaver Base (6B), Weaver Pro (14B), and Weaver Ultra (34B) sizes, suitable for different applications and can be dynamically dispatched by a routing agent according to query complexity to balance response quality and computation cost. Evaluation on a carefully curated benchmark for assessing the writing capabilities of LLMs shows Weaver models of all sizes outperform generalist LLMs several times larger than them. Notably, our most-capable Weaver Ultra model surpasses GPT-4, a state-of-the-art generalist LLM, on various writing scenarios, demonstrating the advantage of training specialized LLMs for writing purposes. Moreover, Weaver natively supports retrieval-augmented generation (RAG) and function calling (tool usage). We present various use cases of these abilities for improving AI-assisted writing systems, including integration of external knowledge bases, tools, or APIs, and providing personalized writing assistance. Furthermore, we discuss and summarize a guideline and best practices for pre-training and fine-tuning domain-specific LLMs.
PDF456December 15, 2024