ChatPaper.aiChatPaper

PRING: Heroverweging van eiwit-eiwitinteractievoorspelling van paren naar grafieken

PRING: Rethinking Protein-Protein Interaction Prediction from Pairs to Graphs

July 7, 2025
Auteurs: Xinzhe Zheng, Hao Du, Fanding Xu, Jinzhe Li, Zhiyuan Liu, Wenkang Wang, Tao Chen, Wanli Ouyang, Stan Z. Li, Yan Lu, Nanqing Dong, Yang Zhang
cs.AI

Samenvatting

Diepgaand leren-gebaseerde computationele methoden hebben veelbelovende resultaten behaald in het voorspellen van eiwit-eiwitinteracties (PPIs). Bestaande benchmarks richten zich echter voornamelijk op geïsoleerde paarsgewijze evaluaties, waarbij het vermogen van een model om biologisch betekenisvolle PPI-netwerken te reconstrueren over het hoofd wordt gezien, wat cruciaal is voor biologisch onderzoek. Om deze kloof te overbruggen, introduceren we PRING, de eerste uitgebreide benchmark die eiwit-eiwitinteractievoorspelling evalueert vanuit een grafiekniveau perspectief. PRING stelt een hoogwaardige, multi-soort PPI-netwerkdataset samen, bestaande uit 21.484 eiwitten en 186.818 interacties, met goed doordachte strategieën om zowel dataredundantie als -lekkage aan te pakken. Op basis van deze gouden standaarddataset stellen we twee complementaire evaluatieparadigma's vast: (1) topologiegerichte taken, die de intra- en cross-soort PPI-netwerkconstructie beoordelen, en (2) functiegerichte taken, waaronder voorspelling van eiwitcomplexpaden, GO-moduleanalyse en rechtvaardiging van essentiële eiwitten. Deze evaluaties weerspiegelen niet alleen het vermogen van het model om de netwerktopologie te begrijpen, maar vergemakkelijken ook eiwitfunctieannotatie, detectie van biologische modules en zelfs analyse van ziekte mechanismen. Uitgebreide experimenten op vier representatieve modelcategorieën, bestaande uit sequentie-gelijkenis-gebaseerde, naïeve sequentie-gebaseerde, eiwit-taalmodel-gebaseerde en structuur-gebaseerde benaderingen, tonen aan dat huidige PPI-modellen potentiële beperkingen hebben in het herstellen van zowel structurele als functionele eigenschappen van PPI-netwerken, wat de kloof in het ondersteunen van real-world biologische toepassingen benadrukt. Wij geloven dat PRING een betrouwbaar platform biedt om de ontwikkeling van effectievere PPI-voorspellingsmodellen voor de gemeenschap te begeleiden. De dataset en broncode van PRING zijn beschikbaar op https://github.com/SophieSarceau/PRING.
English
Deep learning-based computational methods have achieved promising results in predicting protein-protein interactions (PPIs). However, existing benchmarks predominantly focus on isolated pairwise evaluations, overlooking a model's capability to reconstruct biologically meaningful PPI networks, which is crucial for biology research. To address this gap, we introduce PRING, the first comprehensive benchmark that evaluates protein-protein interaction prediction from a graph-level perspective. PRING curates a high-quality, multi-species PPI network dataset comprising 21,484 proteins and 186,818 interactions, with well-designed strategies to address both data redundancy and leakage. Building on this golden-standard dataset, we establish two complementary evaluation paradigms: (1) topology-oriented tasks, which assess intra and cross-species PPI network construction, and (2) function-oriented tasks, including protein complex pathway prediction, GO module analysis, and essential protein justification. These evaluations not only reflect the model's capability to understand the network topology but also facilitate protein function annotation, biological module detection, and even disease mechanism analysis. Extensive experiments on four representative model categories, consisting of sequence similarity-based, naive sequence-based, protein language model-based, and structure-based approaches, demonstrate that current PPI models have potential limitations in recovering both structural and functional properties of PPI networks, highlighting the gap in supporting real-world biological applications. We believe PRING provides a reliable platform to guide the development of more effective PPI prediction models for the community. The dataset and source code of PRING are available at https://github.com/SophieSarceau/PRING.
PDF111July 9, 2025