AAVGen: Ingegneria di Precisione dei Capsidi Virali Adeno-associati per il Targeting Selettivo Renale
AAVGen: Precision Engineering of Adeno-associated Viral Capsids for Renal Selective Targeting
February 21, 2026
Autori: Mohammadreza Ghaffarzadeh-Esfahani, Yousof Gheisari
cs.AI
Abstract
I virus adeno-associati (AAV) sono vettori promettenti per la terapia genica, ma i loro sierotipi nativi presentano limitazioni nel tropismo tissutale, nell'evasione immunitaria e nell'efficienza produttiva. L'ingegnerizzazione dei capsidi per superare questi ostacoli è complessa a causa del vasto spazio delle sequenze e della difficoltà di ottimizzare simultaneamente multiple proprietà funzionali. La complessità aumenta ulteriormente quando si considera il rene, che presenta barriere anatomiche uniche e bersagli cellulari che richiedono un'ingegneria vettoriale precisa ed efficiente. Qui presentiamo AAVGen, un framework di intelligenza artificiale generativa per la progettazione de novo di capsidi AAV con profili multi-caratteristica potenziati. AAVGen integra un modello linguistico proteico (PLM) con l'addestramento supervisionato fine (SFT) e una tecnica di apprendimento per rinforzo denominata Ottimizzazione della Politica di Sequenza di Gruppo (GSPO). Il modello è guidato da un segnale di ricompensa composito derivato da tre predittori di regressione basati su ESM-2, ciascuno addestrato per predire una proprietà chiave: idoneità produttiva, tropismo renale e termostabilità. I nostri risultati dimostrano che AAVGen produce una libreria diversificata di nuove sequenze proteiche VP1. Le validazioni in silico hanno rivelato che la maggior parte delle varianti generate ha prestazioni superiori in tutti e tre gli indici impiegati, indicando un'ottimizzazione multi-obiettivo di successo. Inoltre, l'analisi strutturale tramite AlphaFold3 conferma che le sequenze generate preservano il ripiegamento canonico del capside nonostante la diversificazione sequenziale. AAVGen getta le basi per un'ingegneria vettoriale virale guidata dai dati, accelerando lo sviluppo di vettori AAV di prossima generazione con caratteristiche funzionali su misura.
English
Adeno-associated viruses (AAVs) are promising vectors for gene therapy, but their native serotypes face limitations in tissue tropism, immune evasion, and production efficiency. Engineering capsids to overcome these hurdles is challenging due to the vast sequence space and the difficulty of simultaneously optimizing multiple functional properties. The complexity also adds when it comes to the kidney, which presents unique anatomical barriers and cellular targets that require precise and efficient vector engineering. Here, we present AAVGen, a generative artificial intelligence framework for de novo design of AAV capsids with enhanced multi-trait profiles. AAVGen integrates a protein language model (PLM) with supervised fine-tuning (SFT) and a reinforcement learning technique termed Group Sequence Policy Optimization (GSPO). The model is guided by a composite reward signal derived from three ESM-2-based regression predictors, each trained to predict a key property: production fitness, kidney tropism, and thermostability. Our results demonstrate that AAVGen produces a diverse library of novel VP1 protein sequences. In silico validations revealed that the majority of the generated variants have superior performance across all three employed indices, indicating successful multi-objective optimization. Furthermore, structural analysis via AlphaFold3 confirms that the generated sequences preserve the canonical capsid folding despite sequence diversification. AAVGen establishes a foundation for data-driven viral vector engineering, accelerating the development of next-generation AAV vectors with tailored functional characteristics.