Seed Diffusion: Ein großskaliges Diffusionssprachmodell mit Hochgeschwindigkeits-Inferenz

papers.abstract

Wir präsentieren Seed Diffusion Preview, ein großskaliges Sprachmodell basierend auf diskret-zuständiger Diffusion, das eine bemerkenswert schnelle Inferenzgeschwindigkeit bietet. Dank nicht-sequentieller, paralleler Generierung ermöglichen diskrete Diffusionsmodelle eine deutliche Beschleunigung, um die inhärente Latenz der Token-für-Token-Decodierung zu verringern, wie kürzlich gezeigt wurde (z. B. Mercury Coder, Gemini Diffusion). Seed Diffusion Preview erreicht eine Inferenzgeschwindigkeit von 2.146 Token/s auf H20-GPUs und behält dabei eine wettbewerbsfähige Leistung über eine Reihe von Standard-Code-Evaluierungsbenchmarks bei, was deutlich schneller ist als die aktuellen Mercury- und Gemini-Diffusion-Modelle und somit einen neuen Stand der Technik auf der Geschwindigkeits-Qualitäts-Pareto-Grenze für Codemodelle etabliert.

English

We present Seed Diffusion Preview, a large-scale language model based on discrete-state diffusion, offering remarkably fast inference speed. Thanks to non-sequential, parallel generation, discrete diffusion models provide a notable speedup to mitigate the inherent latency of token-by-token decoding, as demonstrated recently (e.g., Mercury Coder, Gemini Diffusion). Seed Diffusion Preview achieves an inference speed of 2,146 token/s over H20 GPUs while maintaining competitive performance across a sweep of standard code evaluation benchmarks, significantly faster than contemporary Mercury and Gemini Diffusion, establishing new state of the art on the speed-quality Pareto frontier for code models.

Seed Diffusion: Ein großskaliges Diffusionssprachmodell mit Hochgeschwindigkeits-Inferenz

Seed Diffusion: A Large-Scale Diffusion Language Model with High-Speed Inference

papers.abstract

Support