ChatPaper.aiChatPaper

Imparare a Scoprire Elementi Regolatori per la Previsione dell'Espressione Genica

Learning to Discover Regulatory Elements for Gene Expression Prediction

February 19, 2025
Autori: Xingyu Su, Haiyang Yu, Degui Zhi, Shuiwang Ji
cs.AI

Abstract

Consideriamo il problema della previsione delle espressioni geniche a partire dalle sequenze di DNA. Una delle principali sfide di questo compito è individuare gli elementi regolatori che controllano le espressioni geniche. In questo lavoro, introduciamo Seq2Exp, una rete Sequence to Expression progettata specificamente per scoprire ed estrarre gli elementi regolatori che guidano l'espressione genica target, migliorando l'accuratezza della previsione dell'espressione genica. Il nostro approccio cattura la relazione causale tra i segnali epigenomici, le sequenze di DNA e i loro elementi regolatori associati. Nello specifico, proponiamo di scomporre i segnali epigenomici e la sequenza di DNA condizionati agli elementi regolatori attivi causali, e di applicare un collo di bottiglia informativo con la distribuzione Beta per combinare i loro effetti filtrando i componenti non causali. I nostri esperimenti dimostrano che Seq2Exp supera i metodi di riferimento esistenti nei compiti di previsione dell'espressione genica e scopre regioni influenti rispetto ai metodi statistici comunemente utilizzati per il rilevamento di picchi, come MACS3. Il codice sorgente è rilasciato come parte della libreria AIRS (https://github.com/divelab/AIRS/).
English
We consider the problem of predicting gene expressions from DNA sequences. A key challenge of this task is to find the regulatory elements that control gene expressions. Here, we introduce Seq2Exp, a Sequence to Expression network explicitly designed to discover and extract regulatory elements that drive target gene expression, enhancing the accuracy of the gene expression prediction. Our approach captures the causal relationship between epigenomic signals, DNA sequences and their associated regulatory elements. Specifically, we propose to decompose the epigenomic signals and the DNA sequence conditioned on the causal active regulatory elements, and apply an information bottleneck with the Beta distribution to combine their effects while filtering out non-causal components. Our experiments demonstrate that Seq2Exp outperforms existing baselines in gene expression prediction tasks and discovers influential regions compared to commonly used statistical methods for peak detection such as MACS3. The source code is released as part of the AIRS library (https://github.com/divelab/AIRS/).

Summary

AI-Generated Summary

PDF22February 24, 2025