ChatPaper.aiChatPaper

Seed Diffusion: Un Modello Linguistico di Diffusione su Larga Scala con Inferenza ad Alta Velocità

Seed Diffusion: A Large-Scale Diffusion Language Model with High-Speed Inference

August 4, 2025
Autori: Yuxuan Song, Zheng Zhang, Cheng Luo, Pengyang Gao, Fan Xia, Hao Luo, Zheng Li, Yuehang Yang, Hongli Yu, Xingwei Qu, Yuwei Fu, Jing Su, Ge Zhang, Wenhao Huang, Mingxuan Wang, Lin Yan, Xiaoying Jia, Jingjing Liu, Wei-Ying Ma, Ya-Qin Zhang, Yonghui Wu, Hao Zhou
cs.AI

Abstract

Presentiamo Seed Diffusion Preview, un modello linguistico su larga scala basato sulla diffusione a stati discreti, che offre una velocità di inferenza straordinariamente elevata. Grazie alla generazione parallela e non sequenziale, i modelli di diffusione discreta garantiscono un notevole aumento di velocità per mitigare la latenza intrinseca della decodifica token per token, come dimostrato di recente (ad esempio, Mercury Coder, Gemini Diffusion). Seed Diffusion Preview raggiunge una velocità di inferenza di 2.146 token/s su GPU H20, mantenendo prestazioni competitive su una gamma di benchmark standard per la valutazione del codice, risultando significativamente più veloce rispetto ai contemporanei Mercury e Gemini Diffusion, stabilendo così un nuovo stato dell'arte sul fronte Pareto velocità-qualità per i modelli di codice.
English
We present Seed Diffusion Preview, a large-scale language model based on discrete-state diffusion, offering remarkably fast inference speed. Thanks to non-sequential, parallel generation, discrete diffusion models provide a notable speedup to mitigate the inherent latency of token-by-token decoding, as demonstrated recently (e.g., Mercury Coder, Gemini Diffusion). Seed Diffusion Preview achieves an inference speed of 2,146 token/s over H20 GPUs while maintaining competitive performance across a sweep of standard code evaluation benchmarks, significantly faster than contemporary Mercury and Gemini Diffusion, establishing new state of the art on the speed-quality Pareto frontier for code models.
PDF13017August 6, 2025