RedOne: Revelando o Pós-Treinamento de LLMs Específicos para Domínios em Serviços de Redes Sociais

Resumo

Como principal meio de disseminação de informações na era moderna, os serviços de redes sociais (SNS) têm experimentado um crescimento acelerado, o que tem apresentado desafios significativos para a gestão de conteúdo nas plataformas e a melhoria da qualidade das interações. Recentemente, o desenvolvimento de modelos de linguagem de grande escala (LLMs) tem oferecido soluções potenciais, mas os estudos existentes focam em tarefas isoladas, que não apenas enfrentam benefícios decrescentes com o escalonamento de dados em cenários individuais, mas também falham em se adaptar de forma flexível a diversos contextos do mundo real. Para enfrentar esses desafios, apresentamos o RedOne, um LLM específico para domínio, projetado para superar o gargalo de desempenho das abordagens de tarefa única e estabelecer uma base abrangente para os SNS. O RedOne foi desenvolvido por meio de uma estratégia de treinamento em três etapas, consistindo em pré-treinamento contínuo, ajuste fino supervisionado e otimização de preferências, utilizando um extenso conjunto de dados do mundo real. Por meio de experimentos extensivos, o RedOne mantém capacidades gerais robustas e alcança uma melhoria média de até 14,02% em 8 tarefas principais de SNS e 7,56% no benchmark de avaliação bilíngue de SNS, em comparação com os modelos base. Além disso, por meio de testes online, o RedOne reduziu a taxa de exposição na detecção de conteúdo prejudicial em 11,23% e melhorou a taxa de cliques na busca pós-visualização em 14,95%, em comparação com modelos de linha de base ajustados para tarefas únicas. Esses resultados estabelecem o RedOne como um LLM robusto e específico para SNS, demonstrando excelente generalização em várias tarefas e aplicabilidade promissora em cenários do mundo real.

English

As a primary medium for modern information dissemination, social networking services (SNS) have experienced rapid growth, which has proposed significant challenges for platform content management and interaction quality improvement. Recently, the development of large language models (LLMs) has offered potential solutions but existing studies focus on isolated tasks, which not only encounter diminishing benefit from the data scaling within individual scenarios but also fail to flexibly adapt to diverse real-world context. To address these challenges, we introduce RedOne, a domain-specific LLM designed to break the performance bottleneck of single-task baselines and establish a comprehensive foundation for the SNS. RedOne was developed through a three-stage training strategy consisting of continue pretraining, supervised fine-tuning, and preference optimization, using a large-scale real-world dataset. Through extensive experiments, RedOne maintains strong general capabilities, and achieves an average improvement up to 14.02% across 8 major SNS tasks and 7.56% in SNS bilingual evaluation benchmark, compared with base models. Furthermore, through online testing, RedOne reduced the exposure rate in harmful content detection by 11.23% and improved the click page rate in post-view search by 14.95% compared with single-tasks finetuned baseline models. These results establish RedOne as a robust domain-specific LLM for SNS, demonstrating excellent generalization across various tasks and promising applicability in real-world scenarios.

RedOne: Revelando o Pós-Treinamento de LLMs Específicos para Domínios em Serviços de Redes Sociais

RedOne: Revealing Domain-specific LLM Post-Training in Social Networking Services

Resumo

Support