La modellazione strutturale allineata al fitness consente uno screening virtuale scalabile con AuroBind
Fitness aligned structural modeling enables scalable virtual screening with AuroBind
August 4, 2025
Autori: Zhongyue Zhang, Jiahua Rao, Jie Zhong, Weiqiang Bai, Dongxue Wang, Shaobo Ning, Lifeng Qiao, Sheng Xu, Runze Ma, Will Hua, Jack Xiaoyu Chen, Odin Zhang, Wei Lu, Hanyi Feng, He Yang, Xinchao Shi, Rui Li, Wanli Ouyang, Xinzhu Ma, Jiahao Wang, Jixian Zhang, Jia Duan, Siqi Sun, Jian Zhang, Shuangjia Zheng
cs.AI
Abstract
La maggior parte delle proteine umane rimane non bersagliata da farmaci, con oltre il 96% delle proteine umane non sfruttate da terapie approvate. Sebbene lo screening virtuale basato sulla struttura prometta di espandere il proteoma bersagliabile, i metodi esistenti mancano di precisione a livello atomico e non riescono a prevedere l'affinità di legame, limitando l'impatto traslazionale. Presentiamo AuroBind, un framework scalabile per lo screening virtuale che ottimizza un modello strutturale personalizzato a livello atomico su dati chemiogenomici su scala milioni. AuroBind integra l'ottimizzazione diretta delle preferenze, l'auto-distillazione da complessi ad alta confidenza e una strategia di accelerazione insegnante-studente per prevedere congiuntamente le strutture legate ai ligandi e l'affinità di legame. I modelli proposti superano i modelli all'avanguardia su benchmark strutturali e funzionali, consentendo uno screening 100.000 volte più veloce su librerie di composti ultra-ampie. In uno screening prospettico su dieci target rilevanti per malattie, AuroBind ha raggiunto tassi di successo sperimentali del 7-69%, con i composti migliori che raggiungono potenze da sub-nanomolari a picomolari. Per i GPCR orfani GPR151 e GPR160, AuroBind ha identificato sia agonisti che antagonisti con tassi di successo del 16-30%, e saggi funzionali hanno confermato la modulazione di GPR160 in modelli di cancro al fegato e alla prostata. AuroBind offre un framework generalizzabile per l'apprendimento struttura-funzione e lo screening molecolare ad alto rendimento, colmando il divario tra la previsione strutturale e la scoperta terapeutica.
English
Most human proteins remain undrugged, over 96% of human proteins remain
unexploited by approved therapeutics. While structure-based virtual screening
promises to expand the druggable proteome, existing methods lack atomic-level
precision and fail to predict binding fitness, limiting translational impact.
We present AuroBind, a scalable virtual screening framework that fine-tunes a
custom atomic-level structural model on million-scale chemogenomic data.
AuroBind integrates direct preference optimization, self-distillation from
high-confidence complexes, and a teacher-student acceleration strategy to
jointly predict ligand-bound structures and binding fitness. The proposed
models outperform state-of-the-art models on structural and functional
benchmarks while enabling 100,000-fold faster screening across ultra-large
compound libraries. In a prospective screen across ten disease-relevant
targets, AuroBind achieved experimental hit rates of 7-69%, with top compounds
reaching sub-nanomolar to picomolar potency. For the orphan GPCRs GPR151 and
GPR160, AuroBind identified both agonists and antagonists with success rates of
16-30%, and functional assays confirmed GPR160 modulation in liver and prostate
cancer models. AuroBind offers a generalizable framework for structure-function
learning and high-throughput molecular screening, bridging the gap between
structure prediction and therapeutic discovery.