[英]counting occurrences in data.frame in r
我有一個數據框200列,每列包含150個基因(行)。
我想計算整個數據框中每個基因的出現次數
mydat <-
V1 V2 V3 V4 V5 V6 V7 V8
1 TGFBR2 TGFBR2 TGFBR2 TGFBR2 TGFBR2 TGFBR2 TGFBR2 TGFBR2
2 MAML2 MAML2 MAML2 MAML2 MAML2 MAML2 MAML2 MAML2
3 BMPR2 EIF5A WRAP53 WRAP53 EIF5A EIF5A EIF5A EIF5A
4 EIF5A BMPR2 EIF5A EIF5A ADAMTSL3 BMPR2 WRAP53 BMPR2
5 EIF5AL1 WRAP53 ADAMTSL3 BMPR2 BMPR2 WRAP53 BMPR2 EIF5AL1
6 WRAP53 EIF5AL1 BMPR2 ADAMTSL3 WRAP53 EIF5AL1 EIF5AL1 WRAP53
7 TBC1D5 ADAMTSL3 EIF5AL1 EIF5AL1 EIF5AL1 ADAMTSL3 ADAMTSL3 C1QTNF7
8 ADAMTSL3 C1QTNF7 C1QTNF7 C1QTNF7 FHL1 YAP1 AURKB ADAMTSL3
9 C1QTNF7 FHL1 RGS7BP LIFR C1QTNF7 TMEM43 C1QTNF7 LIFR
10 AURKB RGS5 AURKB FAM198B AURKB C1QTNF7 PSMB6 PDGFD
所以我希望輸出是這樣的:
occurences
TGFBR2: 8
MALM2 : 8
FHL1: 3
等。但是我想計算數據框中的每個基因。
我該怎么做呢?
嘗試
occurences<-table(unlist(mydat))
(我分配了結果,這樣您就不會獲得完整的基因名稱篩選,因此每個基因的出現都可以通過occurences["genename"]
進行訪問)
table(unlist(mydat))
會成功的
ADAMTSL3 AURKB BMPR2 C1QTNF7 EIF5A EIF5AL1 MAML2 TBC1D5
8 4 8 8 8 8 8 1
TGFBR2 WRAP53 FHL1 RGS5 RGS7BP FAM198B LIFR TMEM43
8 8 2 1 1 1 2 1
YAP1 PSMB6 PDGFD
1 1 1
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.