AAVGen: Ingeniería de Precisión de Cápsides Virales Adeno-asociadas para la Direccionalidad Selectiva Renal
AAVGen: Precision Engineering of Adeno-associated Viral Capsids for Renal Selective Targeting
February 21, 2026
Autores: Mohammadreza Ghaffarzadeh-Esfahani, Yousof Gheisari
cs.AI
Resumen
Los virus adenoasociados (AAV) son vectores prometedores para la terapia génica, pero sus serotipos nativos presentan limitaciones en cuanto a tropismo tisular, evasión inmune y eficiencia de producción. La ingeniería de cápsides para superar estos obstáculos es un desafío debido al vasto espacio de secuencias y la dificultad de optimizar simultáneamente múltiples propiedades funcionales. La complejidad aumenta aún más en el caso del riñón, que presenta barreras anatómicas únicas y dianas celulares que requieren una ingeniería de vectores precisa y eficiente. Aquí presentamos AAVGen, un marco de inteligencia artificial generativa para el diseño de novo de cápsides de AAV con perfiles multitráfico mejorados. AAVGen integra un modelo de lenguaje de proteínas (PLM) con ajuste fino supervisado (SFT) y una técnica de aprendizaje por refuerzo denominada Optimización de Políticas de Secuencias Grupales (GSPO). El modelo se guía por una señal de recompensa compuesta derivada de tres predictores de regresión basados en ESM-2, cada uno entrenado para predecir una propiedad clave: aptitud para la producción, tropismo renal y termoestabilidad. Nuestros resultados demuestran que AAVGen produce una biblioteca diversa de secuencias novedosas de la proteína VP1. Las validaciones in silico revelaron que la mayoría de las variantes generadas tienen un rendimiento superior en los tres índices empleados, lo que indica una optimización multiobjetivo exitosa. Además, el análisis estructural mediante AlphaFold3 confirma que las secuencias generadas preservan el plegamiento canónico de la cápside a pesar de la diversificación de secuencias. AAVGen establece una base para la ingeniería de vectores virales basada en datos, acelerando el desarrollo de vectores AAV de próxima generación con características funcionales a medida.
English
Adeno-associated viruses (AAVs) are promising vectors for gene therapy, but their native serotypes face limitations in tissue tropism, immune evasion, and production efficiency. Engineering capsids to overcome these hurdles is challenging due to the vast sequence space and the difficulty of simultaneously optimizing multiple functional properties. The complexity also adds when it comes to the kidney, which presents unique anatomical barriers and cellular targets that require precise and efficient vector engineering. Here, we present AAVGen, a generative artificial intelligence framework for de novo design of AAV capsids with enhanced multi-trait profiles. AAVGen integrates a protein language model (PLM) with supervised fine-tuning (SFT) and a reinforcement learning technique termed Group Sequence Policy Optimization (GSPO). The model is guided by a composite reward signal derived from three ESM-2-based regression predictors, each trained to predict a key property: production fitness, kidney tropism, and thermostability. Our results demonstrate that AAVGen produces a diverse library of novel VP1 protein sequences. In silico validations revealed that the majority of the generated variants have superior performance across all three employed indices, indicating successful multi-objective optimization. Furthermore, structural analysis via AlphaFold3 confirms that the generated sequences preserve the canonical capsid folding despite sequence diversification. AAVGen establishes a foundation for data-driven viral vector engineering, accelerating the development of next-generation AAV vectors with tailored functional characteristics.