El modelado estructural alineado con la aptitud permite un cribado virtual escalable con AuroBind
Fitness aligned structural modeling enables scalable virtual screening with AuroBind
August 4, 2025
Autores: Zhongyue Zhang, Jiahua Rao, Jie Zhong, Weiqiang Bai, Dongxue Wang, Shaobo Ning, Lifeng Qiao, Sheng Xu, Runze Ma, Will Hua, Jack Xiaoyu Chen, Odin Zhang, Wei Lu, Hanyi Feng, He Yang, Xinchao Shi, Rui Li, Wanli Ouyang, Xinzhu Ma, Jiahao Wang, Jixian Zhang, Jia Duan, Siqi Sun, Jian Zhang, Shuangjia Zheng
cs.AI
Resumen
La mayoría de las proteínas humanas permanecen sin ser objeto de fármacos, ya que más del 96% de las proteínas humanas no han sido explotadas por terapias aprobadas. Aunque el cribado virtual basado en estructuras promete expandir el proteoma farmacológicamente accesible, los métodos existentes carecen de precisión a nivel atómico y no logran predecir la aptitud de unión, lo que limita su impacto traslacional. Presentamos AuroBind, un marco escalable de cribado virtual que ajusta un modelo estructural personalizado a nivel atómico utilizando datos quimio-genómicos a escala de millones. AuroBind integra la optimización directa de preferencias, la auto-distilación a partir de complejos de alta confianza y una estrategia de aceleración maestro-estudiante para predecir conjuntamente estructuras ligadas a ligandos y la aptitud de unión. Los modelos propuestos superan a los modelos de vanguardia en pruebas estructurales y funcionales, permitiendo un cribado 100,000 veces más rápido en bibliotecas de compuestos ultra-grandes. En un cribado prospectivo de diez objetivos relevantes para enfermedades, AuroBind logró tasas de acierto experimental del 7-69%, con compuestos principales que alcanzaron potencias de sub-nanomolar a picomolar. Para los GPCR huérfanos GPR151 y GPR160, AuroBind identificó tanto agonistas como antagonistas con tasas de éxito del 16-30%, y ensayos funcionales confirmaron la modulación de GPR160 en modelos de cáncer de hígado y próstata. AuroBind ofrece un marco generalizable para el aprendizaje de estructura-función y el cribado molecular de alto rendimiento, cerrando la brecha entre la predicción de estructuras y el descubrimiento terapéutico.
English
Most human proteins remain undrugged, over 96% of human proteins remain
unexploited by approved therapeutics. While structure-based virtual screening
promises to expand the druggable proteome, existing methods lack atomic-level
precision and fail to predict binding fitness, limiting translational impact.
We present AuroBind, a scalable virtual screening framework that fine-tunes a
custom atomic-level structural model on million-scale chemogenomic data.
AuroBind integrates direct preference optimization, self-distillation from
high-confidence complexes, and a teacher-student acceleration strategy to
jointly predict ligand-bound structures and binding fitness. The proposed
models outperform state-of-the-art models on structural and functional
benchmarks while enabling 100,000-fold faster screening across ultra-large
compound libraries. In a prospective screen across ten disease-relevant
targets, AuroBind achieved experimental hit rates of 7-69%, with top compounds
reaching sub-nanomolar to picomolar potency. For the orphan GPCRs GPR151 and
GPR160, AuroBind identified both agonists and antagonists with success rates of
16-30%, and functional assays confirmed GPR160 modulation in liver and prostate
cancer models. AuroBind offers a generalizable framework for structure-function
learning and high-throughput molecular screening, bridging the gap between
structure prediction and therapeutic discovery.