AAVGen:腎臓選択的ターゲティングのためのアデノ随伴ウイルスカプシドの精密工学
AAVGen: Precision Engineering of Adeno-associated Viral Capsids for Renal Selective Targeting
February 21, 2026
著者: Mohammadreza Ghaffarzadeh-Esfahani, Yousof Gheisari
cs.AI
要旨
アデノ随伴ウイルス(AAV)は遺伝子治療における有望なベクターであるが、その天然血清型は組織指向性、免疫回避、生産効率において限界に直面している。カプシドの改修によるこれらの課題の克服は、膨大な配列空間と複数の機能特性の同時最適化の困難さから挑戦的である。特に腎臓においては、独特の解剖学的障壁と精密かつ効率的なベクター設計を必要とする細胞標的が存在するため、複雑さが増す。本論文では、複数の特性プロファイルが強化されたAAVカプシドをde novo設計するための生成的AIフレームワーク、AAVGenを提案する。AAVGenは、タンパク質言語モデル(PLM)を教師ありファインチューニング(SFT)およびGroup Sequence Policy Optimization(GSPO)と呼ばれる強化学習技術と統合する。本モデルは、3つのESM-2ベースの回帰予測器(それぞれが生産適合性、腎指向性、熱安定性という主要特性を予測するように訓練された)に由来する複合報酬信号によって導かれる。結果として、AAVGenは多様な新規VP1タンパク質配列ライブラリーを生成する。in silico検証により、生成された変異体の大部分が、採用した3つの指標すべてにおいて優れた性能を示し、多目的最適化の成功が示された。さらに、AlphaFold3による構造解析は、配列の多様化にもかかわらず、生成された配列が標準的なカプシド折り畳みを保持することを確認する。AAVGenは、データ駆動型ウイルスベクター工学の基盤を確立し、機能特性を設計した次世代AAVベクターの開発を加速するものである。
English
Adeno-associated viruses (AAVs) are promising vectors for gene therapy, but their native serotypes face limitations in tissue tropism, immune evasion, and production efficiency. Engineering capsids to overcome these hurdles is challenging due to the vast sequence space and the difficulty of simultaneously optimizing multiple functional properties. The complexity also adds when it comes to the kidney, which presents unique anatomical barriers and cellular targets that require precise and efficient vector engineering. Here, we present AAVGen, a generative artificial intelligence framework for de novo design of AAV capsids with enhanced multi-trait profiles. AAVGen integrates a protein language model (PLM) with supervised fine-tuning (SFT) and a reinforcement learning technique termed Group Sequence Policy Optimization (GSPO). The model is guided by a composite reward signal derived from three ESM-2-based regression predictors, each trained to predict a key property: production fitness, kidney tropism, and thermostability. Our results demonstrate that AAVGen produces a diverse library of novel VP1 protein sequences. In silico validations revealed that the majority of the generated variants have superior performance across all three employed indices, indicating successful multi-objective optimization. Furthermore, structural analysis via AlphaFold3 confirms that the generated sequences preserve the canonical capsid folding despite sequence diversification. AAVGen establishes a foundation for data-driven viral vector engineering, accelerating the development of next-generation AAV vectors with tailored functional characteristics.