ChatPaper.aiChatPaper

Geração de Imagens com um Codificador Esférico

Image Generation with a Sphere Encoder

February 16, 2026
Autores: Kaiyu Yue, Menglin Jia, Ji Hou, Tom Goldstein
cs.AI

Resumo

Apresentamos o Sphere Encoder, uma estrutura generativa eficiente capaz de produzir imagens em uma única passagem direta e competir com modelos de difusão de múltiplas etapas usando menos de cinco passos. Nossa abordagem funciona aprendendo um codificador que mapeia imagens naturais uniformemente para um espaço latente esférico, e um decodificador que mapeia vetores latentes aleatórios de volta para o espaço da imagem. Treinado exclusivamente por meio de perdas de reconstrução de imagem, o modelo gera uma imagem simplesmente decodificando um ponto aleatório na esfera. Nossa arquitetura suporta naturalmente a geração condicional, e o loop entre o codificador e o decodificador por algumas iterações pode aprimorar ainda mais a qualidade da imagem. Em diversos conjuntos de dados, a abordagem do sphere encoder produz desempenho competitivo com as difusões state of the art, mas com uma pequena fração do custo de inferência. A página do projeto está disponível em https://sphere-encoder.github.io.
English
We introduce the Sphere Encoder, an efficient generative framework capable of producing images in a single forward pass and competing with many-step diffusion models using fewer than five steps. Our approach works by learning an encoder that maps natural images uniformly onto a spherical latent space, and a decoder that maps random latent vectors back to the image space. Trained solely through image reconstruction losses, the model generates an image by simply decoding a random point on the sphere. Our architecture naturally supports conditional generation, and looping the encoder/decoder a few times can further enhance image quality. Across several datasets, the sphere encoder approach yields performance competitive with state of the art diffusions, but with a small fraction of the inference cost. Project page is available at https://sphere-encoder.github.io .
PDF154March 17, 2026