[英]Compare several columns of gene names
我有幾列基因符號,我想檢查每列中哪些基因相似
例如,如下三列
ADORA2B ADORA2B KLC1
AGPAT5 HOPX LEPR
ASS1 IGFBP7 LTBP3
C1QBP INHBA MBNL2
C4orf19 ITGB5 MLLT11
CASP1 ITGBL1 NOTCH3
CASP1 ITGBL1 NPR3
CASP1 NUAK1
CASP1 OLR1
CCL20 PDGFC
KBTBD11 PLA2G16
KLF4
ME2
MPDU1
NAT1
PBK
PSMB10
PSMB8
PSMB9
對於具有3列的這種簡單情況,您可以簡單地執行以下操作:
intersect(a,b)
#[1] "ADORA2B"
intersect(a,d)
#character(0)
intersect(b,d)
#character(0)
如果您有更多的基因集,則可能需要其他方法。 盡管肯定有更好的解決方案,但類似的事情可能會起作用:
# Gather up all the vectors you want to use
sets <- c("a","b","d")
# Make all possible pairs of sets
combos <- combn(sets,2)
# look for shared strings between all possible pairs of sets
sapply(1:ncol(combos), function(x) intersect(get(combos[1,x]), get(combos[2,x])))
#[[1]]
#[1] "ADORA2B"
#
#[[2]]
#character(0)
#
#[[3]]
#character(0)
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.