ChatPaper.aiChatPaper

Génération d'images avec un encodeur sphérique

Image Generation with a Sphere Encoder

February 16, 2026
papers.authors: Kaiyu Yue, Menglin Jia, Ji Hou, Tom Goldstein
cs.AI

papers.abstract

Nous présentons le Sphere Encoder, un cadre génératif efficace capable de produire des images en une seule passe avant et rivalisant avec les modèles de diffusion à nombreuses étapes en utilisant moins de cinq étapes. Notre approche consiste à apprendre un encodeur qui projette uniformément les images naturelles dans un espace latent sphérique, et un décodeur qui reconvertit des vecteurs latents aléatoires vers l'espace image. Entraîné uniquement par des pertes de reconstruction d'image, le modèle génère une image en décodant simplement un point aléatoire sur la sphère. Notre architecture prend naturellement en charge la génération conditionnelle, et le bouclage de l'encodeur/décodeur quelques fois peut encore améliorer la qualité de l'image. Sur plusieurs jeux de données, l'approche par encodeur sphérique offre des performances compétitives avec l'état de l'art des diffusions, mais avec une fraction du coût d'inférence. La page du projet est disponible à l'adresse https://sphere-encoder.github.io.
English
We introduce the Sphere Encoder, an efficient generative framework capable of producing images in a single forward pass and competing with many-step diffusion models using fewer than five steps. Our approach works by learning an encoder that maps natural images uniformly onto a spherical latent space, and a decoder that maps random latent vectors back to the image space. Trained solely through image reconstruction losses, the model generates an image by simply decoding a random point on the sphere. Our architecture naturally supports conditional generation, and looping the encoder/decoder a few times can further enhance image quality. Across several datasets, the sphere encoder approach yields performance competitive with state of the art diffusions, but with a small fraction of the inference cost. Project page is available at https://sphere-encoder.github.io .
PDF113February 27, 2026