ChatPaper.aiChatPaper

A modelagem estrutural alinhada por fitness permite a triagem virtual escalável com AuroBind

Fitness aligned structural modeling enables scalable virtual screening with AuroBind

August 4, 2025
Autores: Zhongyue Zhang, Jiahua Rao, Jie Zhong, Weiqiang Bai, Dongxue Wang, Shaobo Ning, Lifeng Qiao, Sheng Xu, Runze Ma, Will Hua, Jack Xiaoyu Chen, Odin Zhang, Wei Lu, Hanyi Feng, He Yang, Xinchao Shi, Rui Li, Wanli Ouyang, Xinzhu Ma, Jiahao Wang, Jixian Zhang, Jia Duan, Siqi Sun, Jian Zhang, Shuangjia Zheng
cs.AI

Resumo

A maioria das proteínas humanas permanece sem medicamentos, com mais de 96% das proteínas humanas não sendo exploradas por terapêuticas aprovadas. Embora a triagem virtual baseada em estrutura prometa expandir o proteoma farmacologicamente explorável, os métodos existentes carecem de precisão em nível atômico e falham em prever a aptidão de ligação, limitando o impacto translacional. Apresentamos o AuroBind, uma estrutura escalável de triagem virtual que ajusta um modelo estrutural personalizado em nível atômico em dados quimiogenômicos em escala de milhões. O AuroBind integra otimização direta de preferência, auto-distilação a partir de complexos de alta confiança e uma estratégia de aceleração professor-aluno para prever conjuntamente estruturas ligadas a ligantes e aptidão de ligação. Os modelos propostos superam os modelos de última geração em benchmarks estruturais e funcionais, permitindo uma triagem 100.000 vezes mais rápida em bibliotecas de compostos ultra-grandes. Em uma triagem prospectiva em dez alvos relevantes para doenças, o AuroBind alcançou taxas de acerto experimental de 7-69%, com os compostos principais atingindo potências de sub-nanomolar a picomolar. Para os GPCRs órfãos GPR151 e GPR160, o AuroBind identificou tanto agonistas quanto antagonistas com taxas de sucesso de 16-30%, e ensaios funcionais confirmaram a modulação do GPR160 em modelos de câncer de fígado e próstata. O AuroBind oferece uma estrutura generalizável para aprendizado de estrutura-função e triagem molecular de alto rendimento, preenchendo a lacuna entre a previsão de estrutura e a descoberta terapêutica.
English
Most human proteins remain undrugged, over 96% of human proteins remain unexploited by approved therapeutics. While structure-based virtual screening promises to expand the druggable proteome, existing methods lack atomic-level precision and fail to predict binding fitness, limiting translational impact. We present AuroBind, a scalable virtual screening framework that fine-tunes a custom atomic-level structural model on million-scale chemogenomic data. AuroBind integrates direct preference optimization, self-distillation from high-confidence complexes, and a teacher-student acceleration strategy to jointly predict ligand-bound structures and binding fitness. The proposed models outperform state-of-the-art models on structural and functional benchmarks while enabling 100,000-fold faster screening across ultra-large compound libraries. In a prospective screen across ten disease-relevant targets, AuroBind achieved experimental hit rates of 7-69%, with top compounds reaching sub-nanomolar to picomolar potency. For the orphan GPCRs GPR151 and GPR160, AuroBind identified both agonists and antagonists with success rates of 16-30%, and functional assays confirmed GPR160 modulation in liver and prostate cancer models. AuroBind offers a generalizable framework for structure-function learning and high-throughput molecular screening, bridging the gap between structure prediction and therapeutic discovery.
PDF232August 5, 2025