Технический отчет Yi-Lightning

Аннотация

В данном техническом отчете представлен Yi-Lightning, наш последний флагманский крупный языковой модель (LLM). Он достигает исключительной производительности, занимая 6-е место в общем рейтинге на Chatbot Arena, с особенно сильными результатами (со 2-го по 4-е место) в специализированных категориях, включая китайский язык, математику, программирование и сложные запросы. Yi-Lightning использует улучшенную архитектуру Mixture-of-Experts (MoE), представляющую собой передовые механизмы сегментации и маршрутизации экспертов, совмещенные с оптимизированными техниками кэширования KV. Наш процесс разработки включает в себя всестороннюю предварительную тренировку, надзорное дообучение (SFT) и обучение с подкреплением на основе обратной связи от человека (RLHF), где мы разрабатываем целенаправленные стратегии для многоэтапного обучения, создания синтетических данных и моделирования вознаграждения. Более того, мы реализуем RAISE (Responsible AI Safety Engine), четырехкомпонентную структуру для решения проблем безопасности на этапах предварительной тренировки, последующей тренировки и обслуживания. Благодаря нашей масштабируемой суперкомпьютерной инфраструктуре, все эти инновации существенно снижают затраты на обучение, развертывание и вывод, сохраняя высокие стандарты производительности. После дальнейших оценок на общедоступных академических бенчмарках Yi-Lightning демонстрирует конкурентоспособную производительность по сравнению с моделями LLM высшего уровня, при этом мы наблюдаем значительное расхождение между традиционными, статическими результатами бенчмарков и динамическими предпочтениями людей в реальном мире. Это наблюдение подталкивает к критической переоценке полезности традиционных бенчмарков для направления развития более интеллектуальных и мощных ИИ-систем для практических применений. Yi-Lightning теперь доступен через нашу платформу разработчиков по адресу https://platform.lingyiwanwu.com.

English

This technical report presents Yi-Lightning, our latest flagship large language model (LLM). It achieves exceptional performance, ranking 6th overall on Chatbot Arena, with particularly strong results (2nd to 4th place) in specialized categories including Chinese, Math, Coding, and Hard Prompts. Yi-Lightning leverages an enhanced Mixture-of-Experts (MoE) architecture, featuring advanced expert segmentation and routing mechanisms coupled with optimized KV-caching techniques. Our development process encompasses comprehensive pre-training, supervised fine-tuning (SFT), and reinforcement learning from human feedback (RLHF), where we devise deliberate strategies for multi-stage training, synthetic data construction, and reward modeling. Furthermore, we implement RAISE (Responsible AI Safety Engine), a four-component framework to address safety issues across pre-training, post-training, and serving phases. Empowered by our scalable super-computing infrastructure, all these innovations substantially reduce training, deployment and inference costs while maintaining high-performance standards. With further evaluations on public academic benchmarks, Yi-Lightning demonstrates competitive performance against top-tier LLMs, while we observe a notable disparity between traditional, static benchmark results and real-world, dynamic human preferences. This observation prompts a critical reassessment of conventional benchmarks' utility in guiding the development of more intelligent and powerful AI systems for practical applications. Yi-Lightning is now available through our developer platform at https://platform.lingyiwanwu.com.

Технический отчет Yi-Lightning

Yi-Lightning Technical Report

Аннотация

Support