피트니스 정렬 구조 모델링은 AuroBind를 활용한 확장 가능한 가상 스크리닝을 가능하게 한다
Fitness aligned structural modeling enables scalable virtual screening with AuroBind
August 4, 2025
저자: Zhongyue Zhang, Jiahua Rao, Jie Zhong, Weiqiang Bai, Dongxue Wang, Shaobo Ning, Lifeng Qiao, Sheng Xu, Runze Ma, Will Hua, Jack Xiaoyu Chen, Odin Zhang, Wei Lu, Hanyi Feng, He Yang, Xinchao Shi, Rui Li, Wanli Ouyang, Xinzhu Ma, Jiahao Wang, Jixian Zhang, Jia Duan, Siqi Sun, Jian Zhang, Shuangjia Zheng
cs.AI
초록
대부분의 인간 단백질은 여전히 약물 표적화되지 않은 상태로, 승인된 치료제에 의해 활용되지 않은 인간 단백질이 96% 이상을 차지한다. 구조 기반 가상 스크리닝은 약물 표적 가능한 단백질체를 확장할 가능성을 보여주지만, 기존 방법들은 원자 수준의 정밀도가 부족하고 결합 적합성을 예측하지 못해 번역적 영향이 제한적이다. 우리는 백만 규모의 화학유전체 데이터에 맞춤화된 원자 수준 구조 모델을 미세 조정하는 확장 가능한 가상 스크리닝 프레임워크인 AuroBind를 제시한다. AuroBind는 직접 선호 최적화, 고신뢰 복합체로부터의 자기 증류, 그리고 교사-학생 가속 전략을 통합하여 리간드 결합 구조와 결합 적합성을 동시에 예측한다. 제안된 모델은 구조적 및 기능적 벤치마크에서 최첨단 모델을 능가하며, 초대규모 화합물 라이브러리에서 100,000배 더 빠른 스크리닝을 가능하게 한다. 10개의 질병 관련 표적에 대한 전향적 스크리닝에서 AuroBind는 7-69%의 실험적 적중률을 달성했으며, 최상위 화합물은 나노몰에서 피코몰 수준의 효능을 보였다. 고아 GPCR인 GPR151과 GPR160에 대해 AuroBind는 작용제와 길항제를 16-30%의 성공률로 식별했으며, 기능적 분석을 통해 간암 및 전립선암 모델에서 GPR160 조절을 확인했다. AuroBind는 구조-기능 학습과 고처리량 분자 스크리닝을 위한 일반화 가능한 프레임워크를 제공하여, 구조 예측과 치료제 발견 간의 격차를 해소한다.
English
Most human proteins remain undrugged, over 96% of human proteins remain
unexploited by approved therapeutics. While structure-based virtual screening
promises to expand the druggable proteome, existing methods lack atomic-level
precision and fail to predict binding fitness, limiting translational impact.
We present AuroBind, a scalable virtual screening framework that fine-tunes a
custom atomic-level structural model on million-scale chemogenomic data.
AuroBind integrates direct preference optimization, self-distillation from
high-confidence complexes, and a teacher-student acceleration strategy to
jointly predict ligand-bound structures and binding fitness. The proposed
models outperform state-of-the-art models on structural and functional
benchmarks while enabling 100,000-fold faster screening across ultra-large
compound libraries. In a prospective screen across ten disease-relevant
targets, AuroBind achieved experimental hit rates of 7-69%, with top compounds
reaching sub-nanomolar to picomolar potency. For the orphan GPCRs GPR151 and
GPR160, AuroBind identified both agonists and antagonists with success rates of
16-30%, and functional assays confirmed GPR160 modulation in liver and prostate
cancer models. AuroBind offers a generalizable framework for structure-function
learning and high-throughput molecular screening, bridging the gap between
structure prediction and therapeutic discovery.