Explicador do Transformer: Aprendizagem Interativa de Modelos Generativos de TextoTransformer Explainer: Interactive Learning of Text-Generative Models
Os Transformers revolucionaram a aprendizagem de máquina, no entanto, seu funcionamento interno permanece opaco para muitos. Apresentamos o Transformer Explainer, uma ferramenta de visualização interativa projetada para não especialistas aprenderem sobre os Transformers por meio do modelo GPT-2. Nossa ferramenta ajuda os usuários a compreender conceitos complexos dos Transformers integrando uma visão geral do modelo e permitindo transições suaves entre os níveis de abstração das operações matemáticas e estruturas do modelo. Ela executa uma instância ao vivo do GPT-2 localmente no navegador do usuário, capacitando os usuários a experimentar com suas próprias entradas e observar em tempo real como os componentes internos e parâmetros do Transformer trabalham juntos para prever os próximos tokens. Nossa ferramenta não requer instalação ou hardware especial, ampliando o acesso educacional do público às técnicas modernas de IA generativa. Nossa ferramenta de código aberto está disponível em https://poloclub.github.io/transformer-explainer/. Uma demonstração em vídeo está disponível em https://youtu.be/ECR4oAwocjs.