La modélisation structurale alignée sur le fitness permet un criblage virtuel évolutif avec AuroBind.
Fitness aligned structural modeling enables scalable virtual screening with AuroBind
August 4, 2025
papers.authors: Zhongyue Zhang, Jiahua Rao, Jie Zhong, Weiqiang Bai, Dongxue Wang, Shaobo Ning, Lifeng Qiao, Sheng Xu, Runze Ma, Will Hua, Jack Xiaoyu Chen, Odin Zhang, Wei Lu, Hanyi Feng, He Yang, Xinchao Shi, Rui Li, Wanli Ouyang, Xinzhu Ma, Jiahao Wang, Jixian Zhang, Jia Duan, Siqi Sun, Jian Zhang, Shuangjia Zheng
cs.AI
papers.abstract
La majorité des protéines humaines restent non ciblées par des médicaments, avec plus de 96 % des protéines humaines inexploitées par les thérapeutiques approuvées. Bien que le criblage virtuel basé sur la structure promette d’élargir le protéome ciblable, les méthodes existantes manquent de précision au niveau atomique et échouent à prédire l’affinité de liaison, limitant ainsi leur impact translationnel. Nous présentons AuroBind, un cadre de criblage virtuel évolutif qui affine un modèle structural personnalisé au niveau atomique sur des données chimiogénomiques à l’échelle du million. AuroBind intègre une optimisation directe des préférences, une auto-distillation à partir de complexes de haute confiance et une stratégie d’accélération enseignant-élève pour prédire conjointement les structures liées aux ligands et l’affinité de liaison. Les modèles proposés surpassent les modèles de pointe sur des benchmarks structurels et fonctionnels tout en permettant un criblage 100 000 fois plus rapide à travers des bibliothèques de composés ultra-larges. Dans un criblage prospectif sur dix cibles pertinentes pour des maladies, AuroBind a atteint des taux de succès expérimentaux de 7 à 69 %, avec des composés de tête atteignant des puissances allant du sub-nanomolaire au picomolaire. Pour les récepteurs orphelins couplés aux protéines G (RCPG) GPR151 et GPR160, AuroBind a identifié à la fois des agonistes et des antagonistes avec des taux de succès de 16 à 30 %, et des essais fonctionnels ont confirmé la modulation de GPR160 dans des modèles de cancer du foie et de la prostate. AuroBind offre un cadre généralisable pour l’apprentissage structure-fonction et le criblage moléculaire à haut débit, comblant ainsi le fossé entre la prédiction de structure et la découverte thérapeutique.
English
Most human proteins remain undrugged, over 96% of human proteins remain
unexploited by approved therapeutics. While structure-based virtual screening
promises to expand the druggable proteome, existing methods lack atomic-level
precision and fail to predict binding fitness, limiting translational impact.
We present AuroBind, a scalable virtual screening framework that fine-tunes a
custom atomic-level structural model on million-scale chemogenomic data.
AuroBind integrates direct preference optimization, self-distillation from
high-confidence complexes, and a teacher-student acceleration strategy to
jointly predict ligand-bound structures and binding fitness. The proposed
models outperform state-of-the-art models on structural and functional
benchmarks while enabling 100,000-fold faster screening across ultra-large
compound libraries. In a prospective screen across ten disease-relevant
targets, AuroBind achieved experimental hit rates of 7-69%, with top compounds
reaching sub-nanomolar to picomolar potency. For the orphan GPCRs GPR151 and
GPR160, AuroBind identified both agonists and antagonists with success rates of
16-30%, and functional assays confirmed GPR160 modulation in liver and prostate
cancer models. AuroBind offers a generalizable framework for structure-function
learning and high-throughput molecular screening, bridging the gap between
structure prediction and therapeutic discovery.