Yi-Blitz Technischer Bericht

papers.abstract

Dieser technische Bericht präsentiert Yi-Lightning, unser neuestes Flaggschiffmodell für große Sprachmodelle (LLM). Es erzielt eine herausragende Leistung und belegt insgesamt den 6. Platz in der Chatbot Arena, mit besonders starken Ergebnissen (Platz 2 bis 4) in spezialisierten Kategorien wie Chinesisch, Mathematik, Codierung und schwierigen Anfragen. Yi-Lightning nutzt eine verbesserte Mixture-of-Experts (MoE) Architektur, die fortschrittliche Expertensegmentierung und Routing-Mechanismen in Verbindung mit optimierten KV-Caching-Techniken bietet. Unser Entwicklungsprozess umfasst umfassendes Pre-Training, überwachtes Feintuning (SFT) und Verstärkungslernen aus menschlichem Feedback (RLHF), bei dem wir gezielte Strategien für das mehrstufige Training, die Konstruktion synthetischer Daten und die Modellierung von Belohnungen entwickeln. Darüber hinaus implementieren wir RAISE (Responsible AI Safety Engine), ein vierkomponentiges Framework zur Bewältigung von Sicherheitsproblemen in den Phasen des Pre-Trainings, Post-Trainings und des Betriebs. Gestärkt durch unsere skalierbare Supercomputing-Infrastruktur reduzieren all diese Innovationen erheblich die Schulungs-, Bereitstellungs- und Inferenzkosten, während gleichzeitig hohe Leistungsstandards aufrechterhalten werden. Durch weitere Evaluierungen an öffentlichen akademischen Benchmarks zeigt Yi-Lightning eine wettbewerbsfähige Leistung gegenüber erstklassigen LLMs, wobei wir eine bemerkenswerte Diskrepanz zwischen traditionellen, statischen Benchmark-Ergebnissen und den dynamischen menschlichen Präferenzen in der realen Welt beobachten. Diese Beobachtung fordert eine kritische Neubewertung des Nutzens konventioneller Benchmarks bei der Entwicklung intelligenterer und leistungsstärkerer KI-Systeme für praktische Anwendungen an. Yi-Lightning ist jetzt über unsere Entwicklerplattform unter https://platform.lingyiwanwu.com verfügbar.

English

This technical report presents Yi-Lightning, our latest flagship large language model (LLM). It achieves exceptional performance, ranking 6th overall on Chatbot Arena, with particularly strong results (2nd to 4th place) in specialized categories including Chinese, Math, Coding, and Hard Prompts. Yi-Lightning leverages an enhanced Mixture-of-Experts (MoE) architecture, featuring advanced expert segmentation and routing mechanisms coupled with optimized KV-caching techniques. Our development process encompasses comprehensive pre-training, supervised fine-tuning (SFT), and reinforcement learning from human feedback (RLHF), where we devise deliberate strategies for multi-stage training, synthetic data construction, and reward modeling. Furthermore, we implement RAISE (Responsible AI Safety Engine), a four-component framework to address safety issues across pre-training, post-training, and serving phases. Empowered by our scalable super-computing infrastructure, all these innovations substantially reduce training, deployment and inference costs while maintaining high-performance standards. With further evaluations on public academic benchmarks, Yi-Lightning demonstrates competitive performance against top-tier LLMs, while we observe a notable disparity between traditional, static benchmark results and real-world, dynamic human preferences. This observation prompts a critical reassessment of conventional benchmarks' utility in guiding the development of more intelligent and powerful AI systems for practical applications. Yi-Lightning is now available through our developer platform at https://platform.lingyiwanwu.com.

Yi-Blitz Technischer Bericht

Yi-Lightning Technical Report

papers.abstract

Support