ChatPaper.aiChatPaper

Aprendizado para Descoberta de Elementos Regulatórios para Predição de Expressão Gênica

Learning to Discover Regulatory Elements for Gene Expression Prediction

February 19, 2025
Autores: Xingyu Su, Haiyang Yu, Degui Zhi, Shuiwang Ji
cs.AI

Resumo

Consideramos o problema de prever expressões gênicas a partir de sequências de DNA. Um desafio chave dessa tarefa é encontrar os elementos regulatórios que controlam as expressões gênicas. Aqui, apresentamos o Seq2Exp, uma rede de Sequência para Expressão explicitamente projetada para descobrir e extrair elementos regulatórios que impulsionam a expressão gênica alvo, melhorando a precisão da previsão de expressão gênica. Nossa abordagem captura a relação causal entre sinais epigenômicos, sequências de DNA e seus elementos regulatórios associados. Especificamente, propomos decompor os sinais epigenômicos e a sequência de DNA condicionados aos elementos regulatórios ativos causais, e aplicar um gargalo de informação com a distribuição Beta para combinar seus efeitos enquanto filtra os componentes não causais. Nossos experimentos demonstram que o Seq2Exp supera as baselines existentes em tarefas de previsão de expressão gênica e descobre regiões influentes em comparação com métodos estatísticos comumente usados para detecção de picos, como o MACS3. O código-fonte está disponível como parte da biblioteca AIRS (https://github.com/divelab/AIRS/).
English
We consider the problem of predicting gene expressions from DNA sequences. A key challenge of this task is to find the regulatory elements that control gene expressions. Here, we introduce Seq2Exp, a Sequence to Expression network explicitly designed to discover and extract regulatory elements that drive target gene expression, enhancing the accuracy of the gene expression prediction. Our approach captures the causal relationship between epigenomic signals, DNA sequences and their associated regulatory elements. Specifically, we propose to decompose the epigenomic signals and the DNA sequence conditioned on the causal active regulatory elements, and apply an information bottleneck with the Beta distribution to combine their effects while filtering out non-causal components. Our experiments demonstrate that Seq2Exp outperforms existing baselines in gene expression prediction tasks and discovers influential regions compared to commonly used statistical methods for peak detection such as MACS3. The source code is released as part of the AIRS library (https://github.com/divelab/AIRS/).

Summary

AI-Generated Summary

PDF22February 24, 2025