AAVGen: Engenharia de Precisão de Capsídeos de Vírus Adeno-associados para Direcionamento Renal Seletivo
AAVGen: Precision Engineering of Adeno-associated Viral Capsids for Renal Selective Targeting
February 21, 2026
Autores: Mohammadreza Ghaffarzadeh-Esfahani, Yousof Gheisari
cs.AI
Resumo
Os vírus adeno-associados (AAVs) são vetores promissores para a terapia gênica, mas os seus serótipos nativos enfrentam limitações no tropismo tecidual, na evasão imune e na eficiência de produção. A engenharia de capsídeos para superar esses obstáculos é desafiadora devido ao vasto espaço de sequência e à dificuldade de otimizar simultaneamente múltiplas propriedades funcionais. A complexidade aumenta ainda mais no caso do rim, que apresenta barreiras anatómicas únicas e alvos celulares que exigem uma engenharia de vetores precisa e eficiente. Apresentamos aqui o AAVGen, um quadro de inteligência artificial generativa para o design *de novo* de capsídeos de AAV com perfis multi-característica aprimorados. O AAVGen integra um modelo de linguagem proteica (PLM) com *fine-tuning* supervisionado (SFT) e uma técnica de aprendizagem por reforço denominada Otimização de Política de Sequência de Grupo (GSPO). O modelo é orientado por um sinal de recompensa composto, derivado de três preditores de regressão baseados em ESM-2, cada um treinado para prever uma propriedade chave: aptidão para produção, tropismo renal e termoestabilidade. Os nossos resultados demonstram que o AAVGen produz uma biblioteca diversificada de sequências novas da proteína VP1. Validações *in silico* revelaram que a maioria das variantes geradas tem um desempenho superior em todos os três índices utilizados, indicando uma otimização multi-objetivo bem-sucedida. Além disso, a análise estrutural via AlphaFold3 confirma que as sequências geradas preservam a dobragem canónica do capsídeo, apesar da diversificação da sequência. O AAVGen estabelece uma base para a engenharia de vetores virais orientada por dados, acelerando o desenvolvimento de vetores de AAV de próxima geração com características funcionais personalizadas.
English
Adeno-associated viruses (AAVs) are promising vectors for gene therapy, but their native serotypes face limitations in tissue tropism, immune evasion, and production efficiency. Engineering capsids to overcome these hurdles is challenging due to the vast sequence space and the difficulty of simultaneously optimizing multiple functional properties. The complexity also adds when it comes to the kidney, which presents unique anatomical barriers and cellular targets that require precise and efficient vector engineering. Here, we present AAVGen, a generative artificial intelligence framework for de novo design of AAV capsids with enhanced multi-trait profiles. AAVGen integrates a protein language model (PLM) with supervised fine-tuning (SFT) and a reinforcement learning technique termed Group Sequence Policy Optimization (GSPO). The model is guided by a composite reward signal derived from three ESM-2-based regression predictors, each trained to predict a key property: production fitness, kidney tropism, and thermostability. Our results demonstrate that AAVGen produces a diverse library of novel VP1 protein sequences. In silico validations revealed that the majority of the generated variants have superior performance across all three employed indices, indicating successful multi-objective optimization. Furthermore, structural analysis via AlphaFold3 confirms that the generated sequences preserve the canonical capsid folding despite sequence diversification. AAVGen establishes a foundation for data-driven viral vector engineering, accelerating the development of next-generation AAV vectors with tailored functional characteristics.