ChatPaper.aiChatPaper

Topic-VQ-VAE: Sfruttare i Codebook Latenti per una Generazione Flessibile di Documenti Guidata da Argomenti

Topic-VQ-VAE: Leveraging Latent Codebooks for Flexible Topic-Guided Document Generation

December 15, 2023
Autori: YoungJoon Yoo, Jongwon Choi
cs.AI

Abstract

Questo articolo introduce un approccio innovativo per il topic modeling che utilizza codebook latenti derivati da un Autoencoder Variazionale Quantizzato Vettoriale (VQ-VAE), incapsulando in modo discreto le ricche informazioni degli embedding pre-addestrati, come quelli di un modello linguistico pre-addestrato. Partendo da una nuova interpretazione dei codebook latenti e degli embedding come bag-of-words concettuali, proponiamo un nuovo modello generativo di topic chiamato Topic-VQ-VAE (TVQ-VAE), che genera inversamente i documenti originali associati ai rispettivi codebook latenti. Il TVQ-VAE è in grado di visualizzare i topic attraverso varie distribuzioni generative, inclusa la tradizionale distribuzione BoW e la generazione autoregressiva di immagini. I nostri risultati sperimentali sull'analisi dei documenti e sulla generazione di immagini dimostrano che il TVQ-VAE cattura efficacemente il contesto dei topic, rivelando le strutture sottostanti del dataset e supportando forme flessibili di generazione di documenti. L'implementazione ufficiale del TVQ-VAE proposto è disponibile all'indirizzo https://github.com/clovaai/TVQ-VAE.
English
This paper introduces a novel approach for topic modeling utilizing latent codebooks from Vector-Quantized Variational Auto-Encoder~(VQ-VAE), discretely encapsulating the rich information of the pre-trained embeddings such as the pre-trained language model. From the novel interpretation of the latent codebooks and embeddings as conceptual bag-of-words, we propose a new generative topic model called Topic-VQ-VAE~(TVQ-VAE) which inversely generates the original documents related to the respective latent codebook. The TVQ-VAE can visualize the topics with various generative distributions including the traditional BoW distribution and the autoregressive image generation. Our experimental results on document analysis and image generation demonstrate that TVQ-VAE effectively captures the topic context which reveals the underlying structures of the dataset and supports flexible forms of document generation. Official implementation of the proposed TVQ-VAE is available at https://github.com/clovaai/TVQ-VAE.
PDF61December 15, 2024