ChatPaper.aiChatPaper

PRING: Neudenken der Vorhersage von Protein-Protein-Interaktionen von Paaren zu Graphen

PRING: Rethinking Protein-Protein Interaction Prediction from Pairs to Graphs

July 7, 2025
papers.authors: Xinzhe Zheng, Hao Du, Fanding Xu, Jinzhe Li, Zhiyuan Liu, Wenkang Wang, Tao Chen, Wanli Ouyang, Stan Z. Li, Yan Lu, Nanqing Dong, Yang Zhang
cs.AI

papers.abstract

Deep-Learning-basierte Berechnungsmethoden haben vielversprechende Ergebnisse bei der Vorhersage von Protein-Protein-Interaktionen (PPIs) erzielt. Bestehende Benchmarks konzentrieren sich jedoch überwiegend auf isolierte paarweise Bewertungen und übersehen dabei die Fähigkeit eines Modells, biologisch bedeutsame PPI-Netzwerke zu rekonstruieren, was für die biologische Forschung entscheidend ist. Um diese Lücke zu schließen, stellen wir PRING vor, den ersten umfassenden Benchmark, der die Vorhersage von Protein-Protein-Interaktionen aus einer Graphen-Perspektive bewertet. PRING kuratiert einen hochwertigen, multi-spezies PPI-Netzwerk-Datensatz, der 21.484 Proteine und 186.818 Interaktionen umfasst, mit gut durchdachten Strategien zur Bewältigung von Datenredundanz und -lecks. Aufbauend auf diesem Goldstandard-Datensatz etablieren wir zwei komplementäre Bewertungsparadigmen: (1) topologieorientierte Aufgaben, die die intra- und inter-spezies PPI-Netzwerkkonstruktion bewerten, und (2) funktionsorientierte Aufgaben, einschließlich der Vorhersage von Proteinkomplex-Pfaden, GO-Modulanalysen und der Begründung essentieller Proteine. Diese Bewertungen spiegeln nicht nur die Fähigkeit des Modells wider, die Netzwerktopologie zu verstehen, sondern erleichtern auch die Annotation von Proteinfunktionen, die Erkennung biologischer Module und sogar die Analyse von Krankheitsmechanismen. Umfangreiche Experimente mit vier repräsentativen Modellkategorien – basierend auf Sequenzähnlichkeit, naiven Sequenzen, Protein-Sprachmodellen und strukturbasierten Ansätzen – zeigen, dass aktuelle PPI-Modelle potenzielle Einschränkungen bei der Wiederherstellung sowohl struktureller als auch funktionaler Eigenschaften von PPI-Netzwerken aufweisen, was die Lücke bei der Unterstützung realer biologischer Anwendungen verdeutlicht. Wir glauben, dass PRING eine zuverlässige Plattform bietet, um die Entwicklung effektiverer PPI-Vorhersagemodelle für die Gemeinschaft zu leiten. Der Datensatz und der Quellcode von PRING sind unter https://github.com/SophieSarceau/PRING verfügbar.
English
Deep learning-based computational methods have achieved promising results in predicting protein-protein interactions (PPIs). However, existing benchmarks predominantly focus on isolated pairwise evaluations, overlooking a model's capability to reconstruct biologically meaningful PPI networks, which is crucial for biology research. To address this gap, we introduce PRING, the first comprehensive benchmark that evaluates protein-protein interaction prediction from a graph-level perspective. PRING curates a high-quality, multi-species PPI network dataset comprising 21,484 proteins and 186,818 interactions, with well-designed strategies to address both data redundancy and leakage. Building on this golden-standard dataset, we establish two complementary evaluation paradigms: (1) topology-oriented tasks, which assess intra and cross-species PPI network construction, and (2) function-oriented tasks, including protein complex pathway prediction, GO module analysis, and essential protein justification. These evaluations not only reflect the model's capability to understand the network topology but also facilitate protein function annotation, biological module detection, and even disease mechanism analysis. Extensive experiments on four representative model categories, consisting of sequence similarity-based, naive sequence-based, protein language model-based, and structure-based approaches, demonstrate that current PPI models have potential limitations in recovering both structural and functional properties of PPI networks, highlighting the gap in supporting real-world biological applications. We believe PRING provides a reliable platform to guide the development of more effective PPI prediction models for the community. The dataset and source code of PRING are available at https://github.com/SophieSarceau/PRING.
PDF111July 9, 2025