簡體   English   中英

使用 R 從 RNAseq 結果摘要文件中提取多個基因集的數據

[英]Extract data of several gene sets from an RNAseq result summary file using R

我正在嘗試從 RNAseq 結果摘要文件中提取幾個基因集的數據:

在此處輸入圖像描述

示例基因列表:

在此處輸入圖像描述

我正在使用 Excel 首先突出顯示重復的基因,對摘要文件進行排序,然后復制我需要的數據。 這很耗時,而且 Excel 在排序時總是“凍結”,特別是對於大基因列表。

我想知道 R 是否可以做得更好。 如果 R 可以成為更好的解決方案,有人可以提供代碼嗎?

我想我得到了解決方案,盡管我仍然需要一一處理這些列表。 無論如何,它比 Excel 快。 :)

# read the RNAseq result summary file
result <- read_excel("RNAseq_Result.xlsx")

# read the gene lists file
geneset <- read_excel("Gene set list.xlsx")

# read one specific list from the gene lists file
ListA <- geneset$ListA

#subsetting
ResultListA <- result[(result$Gene_name) %in% ListA, ]

#output file
write.csv(ResultListA, 'ResultListA.csv')

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM