ニューラルネットワーク拡散Neural Network Diffusion
拡散モデルは、画像や動画の生成において顕著な成功を収めてきました。本研究では、拡散モデルが高性能なニューラルネットワークパラメータの生成にも適用可能であることを実証します。我々のアプローチはシンプルで、オートエンコーダと標準的な潜在拡散モデルを活用します。オートエンコーダは、訓練済みネットワークパラメータのサブセットから潜在表現を抽出します。その後、拡散モデルを訓練して、ランダムノイズからこれらの潜在パラメータ表現を合成します。そして、新たな表現を生成し、それをオートエンコーダのデコーダに通すことで、ネットワークパラメータの新しいサブセットとして即座に使用可能な出力を得ます。様々なアーキテクチャとデータセットにおいて、我々の拡散プロセスは、訓練済みネットワークと同等またはそれ以上の性能を持つモデルを、最小限の追加コストで一貫して生成します。特に、生成されたモデルが訓練済みネットワークとは異なる挙動を示すことを経験的に発見しました。これらの結果は、拡散モデルの多様な活用についてさらなる探求を促すものです。