比較幾列基因名稱

Question

我有幾列基因符號，我想檢查每列中哪些基因相似

例如，如下三列

ADORA2B      ADORA2B    KLC1
AGPAT5       HOPX       LEPR
ASS1         IGFBP7     LTBP3
C1QBP        INHBA      MBNL2
C4orf19      ITGB5      MLLT11
CASP1        ITGBL1     NOTCH3
CASP1        ITGBL1     NPR3
CASP1                   NUAK1
CASP1                   OLR1
CCL20                   PDGFC
KBTBD11                 PLA2G16
KLF4        
ME2     
MPDU1       
NAT1        
PBK     
PSMB10      
PSMB8       
PSMB9

Answer 1

對於具有3列的這種簡單情況，您可以簡單地執行以下操作：

intersect(a,b)
#[1] "ADORA2B"
intersect(a,d)
#character(0)
intersect(b,d)
#character(0)

如果您有更多的基因集，則可能需要其他方法。 盡管肯定有更好的解決方案，但類似的事情可能會起作用：

# Gather up all the vectors you want to use
sets <- c("a","b","d")
# Make all possible pairs of sets
combos <- combn(sets,2)
# look for shared strings between all possible pairs of sets
sapply(1:ncol(combos), function(x) intersect(get(combos[1,x]), get(combos[2,x])))
#[[1]]
#[1] "ADORA2B"
#
#[[2]]
#character(0)
#
#[[3]]
#character(0)

比較幾列基因名稱

問題描述

1 個解決方案

解決方案1
0 已采納 2015-02-09 15:42:36

比較幾列基因名稱

問題描述

1 個解決方案

解決方案1 0 已采納 2015-02-09 15:42:36

解決方案1
0 已采納 2015-02-09 15:42:36