RedOne: Aufdeckung domänenspezifischer LLM-Nachschulungen in sozialen Netzwerkdiensten
RedOne: Revealing Domain-specific LLM Post-Training in Social Networking Services
July 13, 2025
papers.authors: Fei Zhao, Chonggang Lu, Yue Wang, Zheyong Xie, Ziyan Liu, Haofu Qian, JianZhao Huang, Fangcheng Shi, Zijie Meng, Hongcheng Guo, Mingqian He, Xinze Lyu, Yiming Lu, Ziyang Xiang, Zheyu Ye, Chengqiang Lu, Zhe Xu, Yi Wu, Yao Hu, Yan Gao, Jun Fan, Xiaolong Jiang, Weiting Liu, Boyang Wang, Shaosheng Cao
cs.AI
papers.abstract
Als primäres Medium für die moderne Informationsverbreitung haben soziale Netzwerkdienste (SNS) ein rasantes Wachstum erfahren, was erhebliche Herausforderungen für die Plattforminhaltsverwaltung und die Verbesserung der Interaktionsqualität mit sich gebracht hat. In jüngster Zeit hat die Entwicklung großer Sprachmodelle (LLMs) potenzielle Lösungen geboten, doch konzentrieren sich bestehende Studien auf isolierte Aufgaben, die nicht nur einen abnehmenden Nutzen aus der Datenskalierung in einzelnen Szenarien erfahren, sondern auch nicht flexibel an verschiedene reale Kontexte angepasst werden können. Um diese Herausforderungen zu bewältigen, stellen wir RedOne vor, ein domänenspezifisches LLM, das entwickelt wurde, um den Leistungsengpass von Einzelaufgaben-Baselines zu überwinden und eine umfassende Grundlage für SNS zu schaffen. RedOne wurde durch eine dreistufige Trainingsstrategie entwickelt, die aus fortgesetztem Vortraining, überwachtem Feintuning und Präferenzoptimierung besteht, unter Verwendung eines groß angelegten realen Datensatzes. Durch umfangreiche Experimente behält RedOne starke allgemeine Fähigkeiten bei und erreicht im Durchschnitt eine Verbesserung von bis zu 14,02 % über 8 Hauptaufgaben in SNS und 7,56 % im SNS-bilingualen Bewertungsbenchmark im Vergleich zu Basismodellen. Darüber hinaus reduzierte RedOne in Onlinetests die Expositionsrate bei der Erkennung schädlicher Inhalte um 11,23 % und verbesserte die Klickseitenrate bei der Post-View-Suche um 14,95 % im Vergleich zu auf Einzelaufgaben feinabgestimmten Basismodellen. Diese Ergebnisse etablieren RedOne als ein robustes domänenspezifisches LLM für SNS, das eine hervorragende Generalisierung über verschiedene Aufgaben hinweg und vielversprechende Anwendbarkeit in realen Szenarien demonstriert.
English
As a primary medium for modern information dissemination, social networking
services (SNS) have experienced rapid growth, which has proposed significant
challenges for platform content management and interaction quality improvement.
Recently, the development of large language models (LLMs) has offered potential
solutions but existing studies focus on isolated tasks, which not only
encounter diminishing benefit from the data scaling within individual scenarios
but also fail to flexibly adapt to diverse real-world context. To address these
challenges, we introduce RedOne, a domain-specific LLM designed to break the
performance bottleneck of single-task baselines and establish a comprehensive
foundation for the SNS. RedOne was developed through a three-stage training
strategy consisting of continue pretraining, supervised fine-tuning, and
preference optimization, using a large-scale real-world dataset. Through
extensive experiments, RedOne maintains strong general capabilities, and
achieves an average improvement up to 14.02% across 8 major SNS tasks and 7.56%
in SNS bilingual evaluation benchmark, compared with base models. Furthermore,
through online testing, RedOne reduced the exposure rate in harmful content
detection by 11.23% and improved the click page rate in post-view search by
14.95% compared with single-tasks finetuned baseline models. These results
establish RedOne as a robust domain-specific LLM for SNS, demonstrating
excellent generalization across various tasks and promising applicability in
real-world scenarios.