RedOne: Revelando o Pós-Treinamento de LLMs Específicos para Domínios em Serviços de Redes Sociais
RedOne: Revealing Domain-specific LLM Post-Training in Social Networking Services
July 13, 2025
Autores: Fei Zhao, Chonggang Lu, Yue Wang, Zheyong Xie, Ziyan Liu, Haofu Qian, JianZhao Huang, Fangcheng Shi, Zijie Meng, Hongcheng Guo, Mingqian He, Xinze Lyu, Yiming Lu, Ziyang Xiang, Zheyu Ye, Chengqiang Lu, Zhe Xu, Yi Wu, Yao Hu, Yan Gao, Jun Fan, Xiaolong Jiang, Weiting Liu, Boyang Wang, Shaosheng Cao
cs.AI
Resumo
Como principal meio de disseminação de informações na era moderna, os serviços de redes sociais (SNS) têm experimentado um crescimento acelerado, o que tem apresentado desafios significativos para a gestão de conteúdo nas plataformas e a melhoria da qualidade das interações. Recentemente, o desenvolvimento de modelos de linguagem de grande escala (LLMs) tem oferecido soluções potenciais, mas os estudos existentes focam em tarefas isoladas, que não apenas enfrentam benefícios decrescentes com o escalonamento de dados em cenários individuais, mas também falham em se adaptar de forma flexível a diversos contextos do mundo real. Para enfrentar esses desafios, apresentamos o RedOne, um LLM específico para domínio, projetado para superar o gargalo de desempenho das abordagens de tarefa única e estabelecer uma base abrangente para os SNS. O RedOne foi desenvolvido por meio de uma estratégia de treinamento em três etapas, consistindo em pré-treinamento contínuo, ajuste fino supervisionado e otimização de preferências, utilizando um extenso conjunto de dados do mundo real. Por meio de experimentos extensivos, o RedOne mantém capacidades gerais robustas e alcança uma melhoria média de até 14,02% em 8 tarefas principais de SNS e 7,56% no benchmark de avaliação bilíngue de SNS, em comparação com os modelos base. Além disso, por meio de testes online, o RedOne reduziu a taxa de exposição na detecção de conteúdo prejudicial em 11,23% e melhorou a taxa de cliques na busca pós-visualização em 14,95%, em comparação com modelos de linha de base ajustados para tarefas únicas. Esses resultados estabelecem o RedOne como um LLM robusto e específico para SNS, demonstrando excelente generalização em várias tarefas e aplicabilidade promissora em cenários do mundo real.
English
As a primary medium for modern information dissemination, social networking
services (SNS) have experienced rapid growth, which has proposed significant
challenges for platform content management and interaction quality improvement.
Recently, the development of large language models (LLMs) has offered potential
solutions but existing studies focus on isolated tasks, which not only
encounter diminishing benefit from the data scaling within individual scenarios
but also fail to flexibly adapt to diverse real-world context. To address these
challenges, we introduce RedOne, a domain-specific LLM designed to break the
performance bottleneck of single-task baselines and establish a comprehensive
foundation for the SNS. RedOne was developed through a three-stage training
strategy consisting of continue pretraining, supervised fine-tuning, and
preference optimization, using a large-scale real-world dataset. Through
extensive experiments, RedOne maintains strong general capabilities, and
achieves an average improvement up to 14.02% across 8 major SNS tasks and 7.56%
in SNS bilingual evaluation benchmark, compared with base models. Furthermore,
through online testing, RedOne reduced the exposure rate in harmful content
detection by 11.23% and improved the click page rate in post-view search by
14.95% compared with single-tasks finetuned baseline models. These results
establish RedOne as a robust domain-specific LLM for SNS, demonstrating
excellent generalization across various tasks and promising applicability in
real-world scenarios.