Transformer Explainer: テキスト生成モデルのインタラクティブ学習Transformer Explainer: Interactive Learning of Text-Generative Models
Transformerは機械学習に革命をもたらしましたが、その内部動作は多くの人にとって不透明なままです。本論文では、非専門家がGPT-2モデルを通じてTransformerを学ぶためのインタラクティブな可視化ツール「Transformer Explainer」を紹介します。本ツールは、モデルの概要を統合し、数学的操作やモデル構造の抽象化レベル間をスムーズに移行できるようにすることで、複雑なTransformerの概念を理解するのに役立ちます。ユーザーのブラウザ上でローカルにGPT-2のライブインスタンスを実行し、ユーザーが独自の入力を試して、Transformerの内部コンポーネントとパラメータがどのように連携して次のトークンを予測するかをリアルタイムで観察できるようにします。本ツールはインストールや特別なハードウェアを必要とせず、現代の生成AI技術への一般の教育アクセスを広げます。オープンソースの本ツールはhttps://poloclub.github.io/transformer-explainer/で利用可能です。ビデオデモはhttps://youtu.be/ECR4oAwocjsでご覧いただけます。