ChatPaper.aiChatPaper

PRING: Переосмысление предсказания взаимодействий белков от пар к графам

PRING: Rethinking Protein-Protein Interaction Prediction from Pairs to Graphs

July 7, 2025
Авторы: Xinzhe Zheng, Hao Du, Fanding Xu, Jinzhe Li, Zhiyuan Liu, Wenkang Wang, Tao Chen, Wanli Ouyang, Stan Z. Li, Yan Lu, Nanqing Dong, Yang Zhang
cs.AI

Аннотация

Вычислительные методы на основе глубокого обучения достигли значительных успехов в предсказании белково-белковых взаимодействий (ББВ). Однако существующие эталонные тесты в основном сосредоточены на изолированных попарных оценках, упуская из виду способность модели восстанавливать биологически значимые сети ББВ, что крайне важно для биологических исследований. Чтобы устранить этот пробел, мы представляем PRING — первый всеобъемлющий эталонный тест, который оценивает предсказание белково-белковых взаимодействий с точки зрения графов. PRING предлагает высококачественный набор данных о сетях ББВ, охватывающих несколько видов, включающий 21 484 белка и 186 818 взаимодействий, с тщательно разработанными стратегиями для устранения избыточности и утечки данных. На основе этого эталонного набора данных мы устанавливаем две взаимодополняющие парадигмы оценки: (1) задачи, ориентированные на топологию, которые оценивают построение сетей ББВ внутри и между видами, и (2) задачи, ориентированные на функции, включая предсказание путей белковых комплексов, анализ модулей GO и обоснование значимости белков. Эти оценки не только отражают способность модели понимать топологию сети, но также способствуют аннотированию функций белков, обнаружению биологических модулей и даже анализу механизмов заболеваний. Обширные эксперименты с четырьмя репрезентативными категориями моделей, включающими подходы на основе сходства последовательностей, простых последовательностей, языковых моделей белков и структур, демонстрируют, что текущие модели ББВ имеют потенциальные ограничения в восстановлении как структурных, так и функциональных свойств сетей ББВ, подчеркивая разрыв в поддержке реальных биологических приложений. Мы считаем, что PRING предоставляет надежную платформу для разработки более эффективных моделей предсказания ББВ для научного сообщества. Набор данных и исходный код PRING доступны по адресу https://github.com/SophieSarceau/PRING.
English
Deep learning-based computational methods have achieved promising results in predicting protein-protein interactions (PPIs). However, existing benchmarks predominantly focus on isolated pairwise evaluations, overlooking a model's capability to reconstruct biologically meaningful PPI networks, which is crucial for biology research. To address this gap, we introduce PRING, the first comprehensive benchmark that evaluates protein-protein interaction prediction from a graph-level perspective. PRING curates a high-quality, multi-species PPI network dataset comprising 21,484 proteins and 186,818 interactions, with well-designed strategies to address both data redundancy and leakage. Building on this golden-standard dataset, we establish two complementary evaluation paradigms: (1) topology-oriented tasks, which assess intra and cross-species PPI network construction, and (2) function-oriented tasks, including protein complex pathway prediction, GO module analysis, and essential protein justification. These evaluations not only reflect the model's capability to understand the network topology but also facilitate protein function annotation, biological module detection, and even disease mechanism analysis. Extensive experiments on four representative model categories, consisting of sequence similarity-based, naive sequence-based, protein language model-based, and structure-based approaches, demonstrate that current PPI models have potential limitations in recovering both structural and functional properties of PPI networks, highlighting the gap in supporting real-world biological applications. We believe PRING provides a reliable platform to guide the development of more effective PPI prediction models for the community. The dataset and source code of PRING are available at https://github.com/SophieSarceau/PRING.
PDF111July 9, 2025