ChatPaper.aiChatPaper

AAVGen: 신장 선택적 표적화를 위한 아데노 관련 바이러스 캡시드의 정밀 설계

AAVGen: Precision Engineering of Adeno-associated Viral Capsids for Renal Selective Targeting

February 21, 2026
저자: Mohammadreza Ghaffarzadeh-Esfahani, Yousof Gheisari
cs.AI

초록

아데노 관련 바이러스(AAV)는 유전자 치료를 위한 유망한 벡터이지만, 자연 혈청형은 조직 트로피즘, 면역 회피, 생산 효율성 측면에서 한계를 보입니다. 캡시드 공학을 통해 이러한 장애물을 극복하는 것은 방대한 서열 공간과 여러 기능적 특성을 동시에 최적화해야 하는 어려움으로 인해 도전적인 과제입니다. 특히 신장의 경우 독특한 해부학적 장벽과 정밀하고 효율적인 벡터 공학이 필요한 세포 표적을 제시하여 복잡성이 더욱 증가합니다. 본 연구에서는 향상된 다중 형질 프로필을 지닌 AAV 캡시드의 탈노보(de novo) 설계를 위한 생성 인공지능 프레임워크인 AAVGen을 소개합니다. AAVGen은 단백질 언어 모델(PLM)을 지도 미세 조정(SFT) 및 그룹 서열 정책 최적화(GSPO)라는 강화 학습 기술과 통합합니다. 이 모델은 각각 핵심 특성(생산 적합성, 신장 트로피즘, 열안정성)을 예측하도록 훈련된 세 가지 ESM-2 기반 회귀 예측자로부터 도출된 복합 보상 신호에 의해 안내됩니다. 결과에 따르면 AAVGen은 다양한 신규 VP1 단백질 서열 라이브러리를 생성합니다. 실리코 검증을 통해 생성된 변이체의 대다수가 사용된 세 가지 지표 모두에서 우수한 성능을 보여 다중 목표 최적화가 성공적으로 이루어졌음을 확인했습니다. 더 나아가 AlphaFold3를 통한 구조 분석은 서열 다양화에도 불구하고 생성된 서열이 캐논ical 캡시드 폴딩을 유지함을 입증합니다. AAVGen은 데이터 기반 바이러스 벡터 공학의 기초를 마련함으로써 맞춤형 기능적 특성을 지닌 차세대 AAV 벡터 개발을 가속화합니다.
English
Adeno-associated viruses (AAVs) are promising vectors for gene therapy, but their native serotypes face limitations in tissue tropism, immune evasion, and production efficiency. Engineering capsids to overcome these hurdles is challenging due to the vast sequence space and the difficulty of simultaneously optimizing multiple functional properties. The complexity also adds when it comes to the kidney, which presents unique anatomical barriers and cellular targets that require precise and efficient vector engineering. Here, we present AAVGen, a generative artificial intelligence framework for de novo design of AAV capsids with enhanced multi-trait profiles. AAVGen integrates a protein language model (PLM) with supervised fine-tuning (SFT) and a reinforcement learning technique termed Group Sequence Policy Optimization (GSPO). The model is guided by a composite reward signal derived from three ESM-2-based regression predictors, each trained to predict a key property: production fitness, kidney tropism, and thermostability. Our results demonstrate that AAVGen produces a diverse library of novel VP1 protein sequences. In silico validations revealed that the majority of the generated variants have superior performance across all three employed indices, indicating successful multi-objective optimization. Furthermore, structural analysis via AlphaFold3 confirms that the generated sequences preserve the canonical capsid folding despite sequence diversification. AAVGen establishes a foundation for data-driven viral vector engineering, accelerating the development of next-generation AAV vectors with tailored functional characteristics.
PDF11February 25, 2026