A modelagem estrutural alinhada por fitness permite a triagem virtual escalável com AuroBind
Fitness aligned structural modeling enables scalable virtual screening with AuroBind
August 4, 2025
Autores: Zhongyue Zhang, Jiahua Rao, Jie Zhong, Weiqiang Bai, Dongxue Wang, Shaobo Ning, Lifeng Qiao, Sheng Xu, Runze Ma, Will Hua, Jack Xiaoyu Chen, Odin Zhang, Wei Lu, Hanyi Feng, He Yang, Xinchao Shi, Rui Li, Wanli Ouyang, Xinzhu Ma, Jiahao Wang, Jixian Zhang, Jia Duan, Siqi Sun, Jian Zhang, Shuangjia Zheng
cs.AI
Resumo
A maioria das proteínas humanas permanece sem medicamentos, com mais de 96% das proteínas humanas não sendo exploradas por terapêuticas aprovadas. Embora a triagem virtual baseada em estrutura prometa expandir o proteoma farmacologicamente explorável, os métodos existentes carecem de precisão em nível atômico e falham em prever a aptidão de ligação, limitando o impacto translacional. Apresentamos o AuroBind, uma estrutura escalável de triagem virtual que ajusta um modelo estrutural personalizado em nível atômico em dados quimiogenômicos em escala de milhões. O AuroBind integra otimização direta de preferência, auto-distilação a partir de complexos de alta confiança e uma estratégia de aceleração professor-aluno para prever conjuntamente estruturas ligadas a ligantes e aptidão de ligação. Os modelos propostos superam os modelos de última geração em benchmarks estruturais e funcionais, permitindo uma triagem 100.000 vezes mais rápida em bibliotecas de compostos ultra-grandes. Em uma triagem prospectiva em dez alvos relevantes para doenças, o AuroBind alcançou taxas de acerto experimental de 7-69%, com os compostos principais atingindo potências de sub-nanomolar a picomolar. Para os GPCRs órfãos GPR151 e GPR160, o AuroBind identificou tanto agonistas quanto antagonistas com taxas de sucesso de 16-30%, e ensaios funcionais confirmaram a modulação do GPR160 em modelos de câncer de fígado e próstata. O AuroBind oferece uma estrutura generalizável para aprendizado de estrutura-função e triagem molecular de alto rendimento, preenchendo a lacuna entre a previsão de estrutura e a descoberta terapêutica.
English
Most human proteins remain undrugged, over 96% of human proteins remain
unexploited by approved therapeutics. While structure-based virtual screening
promises to expand the druggable proteome, existing methods lack atomic-level
precision and fail to predict binding fitness, limiting translational impact.
We present AuroBind, a scalable virtual screening framework that fine-tunes a
custom atomic-level structural model on million-scale chemogenomic data.
AuroBind integrates direct preference optimization, self-distillation from
high-confidence complexes, and a teacher-student acceleration strategy to
jointly predict ligand-bound structures and binding fitness. The proposed
models outperform state-of-the-art models on structural and functional
benchmarks while enabling 100,000-fold faster screening across ultra-large
compound libraries. In a prospective screen across ten disease-relevant
targets, AuroBind achieved experimental hit rates of 7-69%, with top compounds
reaching sub-nanomolar to picomolar potency. For the orphan GPCRs GPR151 and
GPR160, AuroBind identified both agonists and antagonists with success rates of
16-30%, and functional assays confirmed GPR160 modulation in liver and prostate
cancer models. AuroBind offers a generalizable framework for structure-function
learning and high-throughput molecular screening, bridging the gap between
structure prediction and therapeutic discovery.