ChatPaper.aiChatPaper

Seed Diffusion: Ein großskaliges Diffusionssprachmodell mit Hochgeschwindigkeits-Inferenz

Seed Diffusion: A Large-Scale Diffusion Language Model with High-Speed Inference

August 4, 2025
papers.authors: Yuxuan Song, Zheng Zhang, Cheng Luo, Pengyang Gao, Fan Xia, Hao Luo, Zheng Li, Yuehang Yang, Hongli Yu, Xingwei Qu, Yuwei Fu, Jing Su, Ge Zhang, Wenhao Huang, Mingxuan Wang, Lin Yan, Xiaoying Jia, Jingjing Liu, Wei-Ying Ma, Ya-Qin Zhang, Yonghui Wu, Hao Zhou
cs.AI

papers.abstract

Wir präsentieren Seed Diffusion Preview, ein großskaliges Sprachmodell basierend auf diskret-zuständiger Diffusion, das eine bemerkenswert schnelle Inferenzgeschwindigkeit bietet. Dank nicht-sequentieller, paralleler Generierung ermöglichen diskrete Diffusionsmodelle eine deutliche Beschleunigung, um die inhärente Latenz der Token-für-Token-Decodierung zu verringern, wie kürzlich gezeigt wurde (z. B. Mercury Coder, Gemini Diffusion). Seed Diffusion Preview erreicht eine Inferenzgeschwindigkeit von 2.146 Token/s auf H20-GPUs und behält dabei eine wettbewerbsfähige Leistung über eine Reihe von Standard-Code-Evaluierungsbenchmarks bei, was deutlich schneller ist als die aktuellen Mercury- und Gemini-Diffusion-Modelle und somit einen neuen Stand der Technik auf der Geschwindigkeits-Qualitäts-Pareto-Grenze für Codemodelle etabliert.
English
We present Seed Diffusion Preview, a large-scale language model based on discrete-state diffusion, offering remarkably fast inference speed. Thanks to non-sequential, parallel generation, discrete diffusion models provide a notable speedup to mitigate the inherent latency of token-by-token decoding, as demonstrated recently (e.g., Mercury Coder, Gemini Diffusion). Seed Diffusion Preview achieves an inference speed of 2,146 token/s over H20 GPUs while maintaining competitive performance across a sweep of standard code evaluation benchmarks, significantly faster than contemporary Mercury and Gemini Diffusion, establishing new state of the art on the speed-quality Pareto frontier for code models.
PDF9313August 6, 2025