溶媒:タンパク質フォールディングのためのフレームワーク
Solvent: A Framework for Protein Folding
July 7, 2023
著者: Jaemyung Lee, Jaehoon Kim, Hasun Yu, Youhan Lee
cs.AI
要旨
AI研究を進める上で、一貫性と信頼性は極めて重要です。物体検出など多くの著名な研究分野では、確固たるベンチマークフレームワークを用いて比較と検証が行われてきました。AlphaFold2以降、タンパク質フォールディングの研究は新たな段階に入り、AlphaFold2の構成要素を基にした多くの手法が提案されています。タンパク質フォールディングにおける統一的な研究フレームワークの重要性は、様々なアプローチを一貫して公平に比較するための実装とベンチマークを含んでいます。これを実現するため、我々はSolventを提案します。Solventは、最新モデルの主要な構成要素をオフ・ザ・シェルフ形式でサポートするタンパク質フォールディングフレームワークです。Solventは、統一されたコードベースで実装された異なるモデルを含み、定義されたモデルの同一データセット上での学習と評価をサポートします。我々は、よく知られたアルゴリズムとその構成要素をベンチマークし、タンパク質構造モデリング分野に有用な知見をもたらす実験を提供します。Solventが提案モデルの信頼性と一貫性を高め、速度とコストの両面で効率性をもたらすことで、タンパク質フォールディングモデリング研究の加速に寄与することを期待しています。コードはhttps://github.com/kakaobrain/solventで公開されており、プロジェクトは継続的に開発されます。
English
Consistency and reliability are crucial for conducting AI research. Many
famous research fields, such as object detection, have been compared and
validated with solid benchmark frameworks. After AlphaFold2, the protein
folding task has entered a new phase, and many methods are proposed based on
the component of AlphaFold2. The importance of a unified research framework in
protein folding contains implementations and benchmarks to consistently and
fairly compare various approaches. To achieve this, we present Solvent, an
protein folding framework that supports significant components of
state-of-th-arts models in the manner of off-the-shelf interface Solvent
contains different models implemented in a unified codebase and supports
training and evaluation for defined models on the same dataset. We benchmark
well-known algorithms and their components and provide experiments that give
helpful insights into the protein structure modeling field. We hope that
Solvent will increase the reliability and consistency of proposed models and
gives efficiency in both speed and costs, resulting in acceleration on protein
folding modeling research. The code is available at
https://github.com/kakaobrain/solvent, and the project will continue to be
developed.