簡體   English   中英

計算r中data.frame中的出現

[英]counting occurrences in data.frame in r

我有一個數據框200列,每列包含150個基因(行)。

我想計算整個數據框中每個基因的出現次數

mydat <-

    V1       V2       V3        V4       V5       V6        V7       V8  
1   TGFBR2   TGFBR2   TGFBR2    TGFBR2   TGFBR2   TGFBR2    TGFBR2   TGFBR2
2   MAML2    MAML2    MAML2     MAML2    MAML2    MAML2     MAML2    MAML2
3   BMPR2    EIF5A    WRAP53    WRAP53   EIF5A    EIF5A     EIF5A    EIF5A
4   EIF5A    BMPR2    EIF5A     EIF5A    ADAMTSL3 BMPR2     WRAP53   BMPR2
5   EIF5AL1  WRAP53   ADAMTSL3  BMPR2    BMPR2    WRAP53    BMPR2    EIF5AL1
6   WRAP53   EIF5AL1  BMPR2     ADAMTSL3 WRAP53   EIF5AL1   EIF5AL1  WRAP53
7   TBC1D5   ADAMTSL3 EIF5AL1   EIF5AL1  EIF5AL1  ADAMTSL3  ADAMTSL3 C1QTNF7
8   ADAMTSL3 C1QTNF7  C1QTNF7   C1QTNF7  FHL1     YAP1      AURKB    ADAMTSL3
9   C1QTNF7  FHL1     RGS7BP    LIFR     C1QTNF7  TMEM43    C1QTNF7  LIFR
10  AURKB    RGS5     AURKB     FAM198B  AURKB    C1QTNF7   PSMB6    PDGFD

所以我希望輸出是這樣的:

occurences
TGFBR2: 8
MALM2 : 8
FHL1:   3

等。但是我想計算數據框中的每個基因。

我該怎么做呢?

嘗試

occurences<-table(unlist(mydat))

(我分配了結果,這樣您就不會獲得完整的基因名稱篩選,因此每個基因的出現都可以通過occurences["genename"]進行訪問)

table(unlist(mydat))

會成功的

ADAMTSL3    AURKB    BMPR2  C1QTNF7    EIF5A  EIF5AL1    MAML2   TBC1D5 
       8        4        8        8        8        8        8        1 
  TGFBR2   WRAP53     FHL1     RGS5   RGS7BP  FAM198B     LIFR   TMEM43 
       8        8        2        1        1        1        2        1 
    YAP1    PSMB6    PDGFD 
       1        1        1 

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM