AAVGen: Präzisionsentwicklung von Adeno-assoziierten Viruskapsiden für die renale selektive Zielsteuerung
AAVGen: Precision Engineering of Adeno-associated Viral Capsids for Renal Selective Targeting
February 21, 2026
papers.authors: Mohammadreza Ghaffarzadeh-Esfahani, Yousof Gheisari
cs.AI
papers.abstract
Adeno-assoziierte Viren (AAVs) sind vielversprechende Vektoren für die Gentherapie, doch ihre nativen Serotypen stoßen auf Grenzen hinsichtlich Gewebetropismus, Immunumgehung und Produktionseffizienz. Die Entwicklung von Kapsiden zur Überwindung dieser Hindernisse ist aufgrund des riesigen Sequenzraums und der Schwierigkeit, mehrere funktionelle Eigenschaften gleichzeitig zu optimieren, eine Herausforderung. Die Komplexität erhöht sich zusätzlich bei der Niere, die einzigartige anatomische Barrieren und zelluläre Zielstrukturen aufweist, die eine präzise und effiziente Vektorentechnik erfordern. Hier stellen wir AAVGen vor, ein generatives KI-Framework für den de-novo-Entwurf von AAV-Kapsiden mit verbesserten Multimerkmalprofilen. AAVGen integriert ein Protein-Sprachmodell (PLM) mit überwachtem Fein-Tuning (SFT) und einer Reinforcement-Learning-Technik namens Group Sequence Policy Optimization (GSPO). Das Modell wird durch ein zusammengesetztes Belohnungssignal gesteuert, das von drei ESM-2-basierten Regressionsprädiktoren abgeleitet wird, von denen jeder darauf trainiert ist, eine Schlüsseleigenschaft vorherzusagen: Produktionsfitness, Nierentropismus und Thermostabilität. Unsere Ergebnisse zeigen, dass AAVGen eine vielfältige Bibliothek neuartiger VP1-Proteinsequenzen erzeugt. In-silico-Validierungen ergaben, dass die Mehrheit der generierten Varianten eine überlegene Leistung über alle drei verwendeten Indizes aufweist, was auf eine erfolgreiche Multi-Objective-Optimierung hindeutet. Darüber hinaus bestätigt eine Strukturanalyse mittels AlphaFold3, dass die generierten Sequenzen trotz Sequenzdiversifizierung die kanonische Kapsidfaltung beibehalten. AAVGen legt eine Grundlage für datengestütztes virales Vektoringenieurwesen und beschleunigt die Entwicklung von AAV-Vektoren der nächsten Generation mit maßgeschneiderten funktionellen Eigenschaften.
English
Adeno-associated viruses (AAVs) are promising vectors for gene therapy, but their native serotypes face limitations in tissue tropism, immune evasion, and production efficiency. Engineering capsids to overcome these hurdles is challenging due to the vast sequence space and the difficulty of simultaneously optimizing multiple functional properties. The complexity also adds when it comes to the kidney, which presents unique anatomical barriers and cellular targets that require precise and efficient vector engineering. Here, we present AAVGen, a generative artificial intelligence framework for de novo design of AAV capsids with enhanced multi-trait profiles. AAVGen integrates a protein language model (PLM) with supervised fine-tuning (SFT) and a reinforcement learning technique termed Group Sequence Policy Optimization (GSPO). The model is guided by a composite reward signal derived from three ESM-2-based regression predictors, each trained to predict a key property: production fitness, kidney tropism, and thermostability. Our results demonstrate that AAVGen produces a diverse library of novel VP1 protein sequences. In silico validations revealed that the majority of the generated variants have superior performance across all three employed indices, indicating successful multi-objective optimization. Furthermore, structural analysis via AlphaFold3 confirms that the generated sequences preserve the canonical capsid folding despite sequence diversification. AAVGen establishes a foundation for data-driven viral vector engineering, accelerating the development of next-generation AAV vectors with tailored functional characteristics.