AAVGen : Ingénierie précise des capside virales adéno-associées pour un ciblage rénal sélectif
AAVGen: Precision Engineering of Adeno-associated Viral Capsids for Renal Selective Targeting
February 21, 2026
papers.authors: Mohammadreza Ghaffarzadeh-Esfahani, Yousof Gheisari
cs.AI
papers.abstract
Les adénovirus associés (AAV) sont des vecteurs prometteurs pour la thérapie génique, mais leurs sérotypes natifs présentent des limitations concernant le tropisme tissulaire, l'évasion immunitaire et l'efficacité de production. L'ingénierie des capside pour surmonter ces obstacles est difficile en raison de l'immensité de l'espace séquentiel et de la complexité d'optimiser simultanément plusieurs propriétés fonctionnelles. La complexité s'accroît pour le rein, qui présente des barrières anatomiques uniques et des cibles cellulaires nécessitant une ingénierie vectorielle précise et efficace. Nous présentons ici AAVGen, un cadre d'intelligence artificielle générative pour la conception de novo de capsides AAV avec des profils multi-caractères améliorés. AAVGen intègre un modèle de langage protéique (PLM) avec un fine-tuning supervisé (SFT) et une technique d'apprentissage par renforcement appelée Optimisation de Politique de Séquences par Groupe (GSPO). Le modèle est guidé par un signal de récompense composite dérivé de trois prédicteurs de régression basés sur ESM-2, chacun entraîné pour prédire une propriété clé : l'aptitude à la production, le tropisme rénal et la thermostabilité. Nos résultats démontrent qu'AAVGen produit une bibliothèque diversifiée de nouvelles séquences protéiques VP1. Les validations in silico ont révélé que la majorité des variants générés présentent des performances supérieures sur les trois indices utilisés, indiquant une optimisation multi-objectif réussie. De plus, l'analyse structurelle via AlphaFold3 confirme que les séquences générées préservent le repliement canonique de la capside malgré la diversification des séquences. AAVGen établit une base pour l'ingénierie de vecteurs viraux pilotée par les données, accélérant le développement de vecteurs AAV de nouvelle génération avec des caractéristiques fonctionnelles sur mesure.
English
Adeno-associated viruses (AAVs) are promising vectors for gene therapy, but their native serotypes face limitations in tissue tropism, immune evasion, and production efficiency. Engineering capsids to overcome these hurdles is challenging due to the vast sequence space and the difficulty of simultaneously optimizing multiple functional properties. The complexity also adds when it comes to the kidney, which presents unique anatomical barriers and cellular targets that require precise and efficient vector engineering. Here, we present AAVGen, a generative artificial intelligence framework for de novo design of AAV capsids with enhanced multi-trait profiles. AAVGen integrates a protein language model (PLM) with supervised fine-tuning (SFT) and a reinforcement learning technique termed Group Sequence Policy Optimization (GSPO). The model is guided by a composite reward signal derived from three ESM-2-based regression predictors, each trained to predict a key property: production fitness, kidney tropism, and thermostability. Our results demonstrate that AAVGen produces a diverse library of novel VP1 protein sequences. In silico validations revealed that the majority of the generated variants have superior performance across all three employed indices, indicating successful multi-objective optimization. Furthermore, structural analysis via AlphaFold3 confirms that the generated sequences preserve the canonical capsid folding despite sequence diversification. AAVGen establishes a foundation for data-driven viral vector engineering, accelerating the development of next-generation AAV vectors with tailored functional characteristics.