繁体   English   中英

如何使用biomaRt将安捷伦探针ID列表转换为基因符号并具有na值?

[英]How do I convert a list of agilent probe IDs to gene symbols using biomaRt and have na values?

我正在尝试使用biomaRt将超过90k探针ID的列表转换为基因符号,但是遇到了问题。 使用getBM函数,我可以看到只有22k个具有相应的基因符号,但是输出是长度为22k的向量,而且我看不到与初始探针ID列表的对应关系。 使用getBMlist,我可以得到不匹配的探针指定na值的输出,但是该函数会给出警告消息,表明getBMlist不适用于大列表。 如何获得90k个基因符号和na值的输出?

要获取probeID和基因符号之间的映射,您需要在biomaRt属性中包括probeID。

这是我使用安捷伦微阵列完成某些工作的方式:

genes<-c("A_23_P10060", "A_23_P10091", "A_23_P103951", "A_23_P10525", "A_23_P105732", "A_23_P10605", "NM_005325")

library(biomaRt)
ensembl<-useMart("ensembl", dataset="hsapiens_gene_ensembl")

ensembl.id<-grep("ENST", genes, value=T)
agilent.df<-getBM(attributes = c("hgnc_symbol","efg_agilent_wholegenome_4x44k_v1"), filters=c("efg_agilent_wholegenome_4x44k_v1"),values=genes, mart=ensembl)

genes<-merge(x = as.data.frame(genes),y =  agilent.df, by.y="efg_agilent_wholegenome_4x44k_v1", all.x=T, by.x="genes")

有一个非常好的生物材料教程 ,可以指导您完成相同的过程。 如果运行此代码,您会注意到一个探针将为hgnc_symbol带有“”,这是因为它存在于集成市场中,但没有指定的基因符号。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM