簡體   English   中英

比較幾列基因名稱

[英]Compare several columns of gene names

我有幾列基因符號,我想檢查每列中哪些基因相似

例如,如下三列

ADORA2B      ADORA2B    KLC1
AGPAT5       HOPX       LEPR
ASS1         IGFBP7     LTBP3
C1QBP        INHBA      MBNL2
C4orf19      ITGB5      MLLT11
CASP1        ITGBL1     NOTCH3
CASP1        ITGBL1     NPR3
CASP1                   NUAK1
CASP1                   OLR1
CCL20                   PDGFC
KBTBD11                 PLA2G16
KLF4        
ME2     
MPDU1       
NAT1        
PBK     
PSMB10      
PSMB8       
PSMB9       

對於具有3列的這種簡單情況,您可以簡單地執行以下操作:

intersect(a,b)
#[1] "ADORA2B"
intersect(a,d)
#character(0)
intersect(b,d)
#character(0)

如果您有更多的基因集,則可能需要其他方法。 盡管肯定有更好的解決方案,但類似的事情可能會起作用:

# Gather up all the vectors you want to use
sets <- c("a","b","d")
# Make all possible pairs of sets
combos <- combn(sets,2)
# look for shared strings between all possible pairs of sets
sapply(1:ncol(combos), function(x) intersect(get(combos[1,x]), get(combos[2,x])))
#[[1]]
#[1] "ADORA2B"
#
#[[2]]
#character(0)
#
#[[3]]
#character(0)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM