RedOne: Раскрытие посттренировки доменно-специализированных языковых моделей в сервисах социальных сетей
RedOne: Revealing Domain-specific LLM Post-Training in Social Networking Services
July 13, 2025
Авторы: Fei Zhao, Chonggang Lu, Yue Wang, Zheyong Xie, Ziyan Liu, Haofu Qian, JianZhao Huang, Fangcheng Shi, Zijie Meng, Hongcheng Guo, Mingqian He, Xinze Lyu, Yiming Lu, Ziyang Xiang, Zheyu Ye, Chengqiang Lu, Zhe Xu, Yi Wu, Yao Hu, Yan Gao, Jun Fan, Xiaolong Jiang, Weiting Liu, Boyang Wang, Shaosheng Cao
cs.AI
Аннотация
Как основной канал распространения современной информации, социальные сети (SNS) переживают стремительный рост, что создает значительные вызовы для управления контентом на платформах и повышения качества взаимодействия. В последнее время развитие крупных языковых моделей (LLM) предложило потенциальные решения, однако существующие исследования сосредоточены на изолированных задачах, что не только приводит к снижению отдачи от масштабирования данных в отдельных сценариях, но и не позволяет гибко адаптироваться к разнообразным реальным условиям. Для решения этих проблем мы представляем RedOne, специализированную LLM, разработанную для преодоления ограничений производительности моделей, ориентированных на одну задачу, и создания комплексной основы для SNS. RedOne была разработана с использованием трехэтапной стратегии обучения, включающей продолженное предобучение, тонкую настройку с учителем и оптимизацию предпочтений, на основе крупномасштабного набора реальных данных. В ходе обширных экспериментов RedOne демонстрирует высокие общие способности и достигает среднего улучшения до 14,02% по 8 основным задачам SNS и 7,56% в двуязычном бенчмарке оценки SNS по сравнению с базовыми моделями. Кроме того, в ходе онлайн-тестирования RedOne снизила уровень обнаружения вредоносного контента на 11,23% и повысила показатель кликабельности в поиске после просмотра на 14,95% по сравнению с моделями, настроенными на отдельные задачи. Эти результаты подтверждают, что RedOne является мощной специализированной LLM для SNS, демонстрирующей отличную обобщающую способность в различных задачах и перспективную применимость в реальных сценариях.
English
As a primary medium for modern information dissemination, social networking
services (SNS) have experienced rapid growth, which has proposed significant
challenges for platform content management and interaction quality improvement.
Recently, the development of large language models (LLMs) has offered potential
solutions but existing studies focus on isolated tasks, which not only
encounter diminishing benefit from the data scaling within individual scenarios
but also fail to flexibly adapt to diverse real-world context. To address these
challenges, we introduce RedOne, a domain-specific LLM designed to break the
performance bottleneck of single-task baselines and establish a comprehensive
foundation for the SNS. RedOne was developed through a three-stage training
strategy consisting of continue pretraining, supervised fine-tuning, and
preference optimization, using a large-scale real-world dataset. Through
extensive experiments, RedOne maintains strong general capabilities, and
achieves an average improvement up to 14.02% across 8 major SNS tasks and 7.56%
in SNS bilingual evaluation benchmark, compared with base models. Furthermore,
through online testing, RedOne reduced the exposure rate in harmful content
detection by 11.23% and improved the click page rate in post-view search by
14.95% compared with single-tasks finetuned baseline models. These results
establish RedOne as a robust domain-specific LLM for SNS, demonstrating
excellent generalization across various tasks and promising applicability in
real-world scenarios.