RedOne: Aufdeckung domänenspezifischer LLM-Nachschulungen in sozialen Netzwerkdiensten

papers.abstract

Als primäres Medium für die moderne Informationsverbreitung haben soziale Netzwerkdienste (SNS) ein rasantes Wachstum erfahren, was erhebliche Herausforderungen für die Plattforminhaltsverwaltung und die Verbesserung der Interaktionsqualität mit sich gebracht hat. In jüngster Zeit hat die Entwicklung großer Sprachmodelle (LLMs) potenzielle Lösungen geboten, doch konzentrieren sich bestehende Studien auf isolierte Aufgaben, die nicht nur einen abnehmenden Nutzen aus der Datenskalierung in einzelnen Szenarien erfahren, sondern auch nicht flexibel an verschiedene reale Kontexte angepasst werden können. Um diese Herausforderungen zu bewältigen, stellen wir RedOne vor, ein domänenspezifisches LLM, das entwickelt wurde, um den Leistungsengpass von Einzelaufgaben-Baselines zu überwinden und eine umfassende Grundlage für SNS zu schaffen. RedOne wurde durch eine dreistufige Trainingsstrategie entwickelt, die aus fortgesetztem Vortraining, überwachtem Feintuning und Präferenzoptimierung besteht, unter Verwendung eines groß angelegten realen Datensatzes. Durch umfangreiche Experimente behält RedOne starke allgemeine Fähigkeiten bei und erreicht im Durchschnitt eine Verbesserung von bis zu 14,02 % über 8 Hauptaufgaben in SNS und 7,56 % im SNS-bilingualen Bewertungsbenchmark im Vergleich zu Basismodellen. Darüber hinaus reduzierte RedOne in Onlinetests die Expositionsrate bei der Erkennung schädlicher Inhalte um 11,23 % und verbesserte die Klickseitenrate bei der Post-View-Suche um 14,95 % im Vergleich zu auf Einzelaufgaben feinabgestimmten Basismodellen. Diese Ergebnisse etablieren RedOne als ein robustes domänenspezifisches LLM für SNS, das eine hervorragende Generalisierung über verschiedene Aufgaben hinweg und vielversprechende Anwendbarkeit in realen Szenarien demonstriert.

English

As a primary medium for modern information dissemination, social networking services (SNS) have experienced rapid growth, which has proposed significant challenges for platform content management and interaction quality improvement. Recently, the development of large language models (LLMs) has offered potential solutions but existing studies focus on isolated tasks, which not only encounter diminishing benefit from the data scaling within individual scenarios but also fail to flexibly adapt to diverse real-world context. To address these challenges, we introduce RedOne, a domain-specific LLM designed to break the performance bottleneck of single-task baselines and establish a comprehensive foundation for the SNS. RedOne was developed through a three-stage training strategy consisting of continue pretraining, supervised fine-tuning, and preference optimization, using a large-scale real-world dataset. Through extensive experiments, RedOne maintains strong general capabilities, and achieves an average improvement up to 14.02% across 8 major SNS tasks and 7.56% in SNS bilingual evaluation benchmark, compared with base models. Furthermore, through online testing, RedOne reduced the exposure rate in harmful content detection by 11.23% and improved the click page rate in post-view search by 14.95% compared with single-tasks finetuned baseline models. These results establish RedOne as a robust domain-specific LLM for SNS, demonstrating excellent generalization across various tasks and promising applicability in real-world scenarios.

RedOne: Aufdeckung domänenspezifischer LLM-Nachschulungen in sozialen Netzwerkdiensten

RedOne: Revealing Domain-specific LLM Post-Training in Social Networking Services

papers.abstract

Support