ChatPaper.aiChatPaper

Leren om regulatoire elementen te ontdekken voor genexpressievoorspelling

Learning to Discover Regulatory Elements for Gene Expression Prediction

February 19, 2025
Auteurs: Xingyu Su, Haiyang Yu, Degui Zhi, Shuiwang Ji
cs.AI

Samenvatting

We beschouwen het probleem van het voorspellen van genexpressies op basis van DNA-sequenties. Een belangrijke uitdaging bij deze taak is het vinden van de regulatoire elementen die genexpressies controleren. Hier introduceren we Seq2Exp, een Sequence to Expression-netwerk dat expliciet is ontworpen om regulatoire elementen te ontdekken en te extraheren die doelgenexpressies sturen, waardoor de nauwkeurigheid van de genexpressievoorspelling wordt verbeterd. Onze aanpak vangt de causale relatie tussen epigenomische signalen, DNA-sequenties en hun bijbehorende regulatoire elementen. Specifiek stellen we voor om de epigenomische signalen en de DNA-sequentie te decomponeren, geconditioneerd op de causale actieve regulatoire elementen, en passen we een informatiebottleneck toe met de Beta-verdeling om hun effecten te combineren terwijl niet-causale componenten worden gefilterd. Onze experimenten tonen aan dat Seq2Exp bestaande baseline-methoden overtreft in genexpressievoorspellings taken en invloedrijke regio's ontdekt in vergelijking met veelgebruikte statistische methoden voor piekdetectie zoals MACS3. De broncode is vrijgegeven als onderdeel van de AIRS-bibliotheek (https://github.com/divelab/AIRS/).
English
We consider the problem of predicting gene expressions from DNA sequences. A key challenge of this task is to find the regulatory elements that control gene expressions. Here, we introduce Seq2Exp, a Sequence to Expression network explicitly designed to discover and extract regulatory elements that drive target gene expression, enhancing the accuracy of the gene expression prediction. Our approach captures the causal relationship between epigenomic signals, DNA sequences and their associated regulatory elements. Specifically, we propose to decompose the epigenomic signals and the DNA sequence conditioned on the causal active regulatory elements, and apply an information bottleneck with the Beta distribution to combine their effects while filtering out non-causal components. Our experiments demonstrate that Seq2Exp outperforms existing baselines in gene expression prediction tasks and discovers influential regions compared to commonly used statistical methods for peak detection such as MACS3. The source code is released as part of the AIRS library (https://github.com/divelab/AIRS/).

Summary

AI-Generated Summary

PDF22February 24, 2025