[英]in R, Extracting miRNA names from a dataframe using a column of ENST ids
我有一個數據head(mydataframe)
輸出如下所示的head(mydataframe)
。 我想根據目標列(ENST)提取名稱列(miRNA名稱),這樣就給出了所有出現的miRNA,而無需重復兩次或多次重復ENST id。
每列是一個miRNA,每行是ENST(每個特定的ENST發生一次),並根據miRNA的存在將一個或零存儲為單元格。
name target chrom start end strand
2928 hsa-miR-576-5p ENST00000324219 2 101875410 101875431 +
2929 hsa-miR-483-5p ENST00000324219 2 101876861 101876882 +
3047 hsa-miR-302c* ENST00000264258 2 100989915 100989939 +
3048 hsa-miR-767-3p ENST00000264258 2 100990020 100990039 +
3049 hsa-miR-216a ENST00000264258 2 100989887 100989906 +
3050 hsa-miR-409-3p ENST00000264258 2 100990172 100990194 +
您可以只使用table
。 根據您的data
,請嘗試:
table(data[,c("target","name")])
輸出:
hsa-miR-216a hsa-miR-302c* hsa-miR-409-3p hsa-miR-483-5p hsa-miR-576-5p
ENST00000264258 1 1 1 0 0
ENST00000324219 0 0 0 1 1
hsa-miR-767-3p
ENST00000264258 1
ENST00000324219 0
您可以通過執行以下操作將其存儲在數據框中:
res<-as.data.frame.matrix(table(data[,c("target","name")]))
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.