[英]Biomart in R to convert rssnp to gene name
我在R中有以下代碼。
library(biomaRt)
snp_mart = useMart("ENSEMBL_MART_SNP", dataset="hsapiens_snp")
snp_attributes = c("refsnp_id", "chr_name", "chrom_start",
"associated_gene", "ensembl_gene_stable_id", "minor_allele_freq")
getENSG <- function(rs, mart = snp_mart) {
results <- getBM(attributes = snp_attributes,
filters = "snp_filter", values = rs, mart = mart)
return(results)
}
getENSG("rs144864312")
refsnp_id chr_name chrom_start associated_gene ensembl_gene_stable_id
1 rs144864312 8 20254959 NA ENSG00000061337
minor_allele_freq
1 0.000399361
我沒有生物學背景,因此,如果這是一個明顯的問題,請原諒我。 有人告訴我rs144864312應該與基因名稱“ LZTS1”匹配。 上面的代碼主要來自互聯網。 我的問題是我從哪里提取該基因名稱? 我知道listAttributes(snp_mart)給出了所有可能輸出的列表,但是我看不到任何給我上述“基因名稱”的東西。 我該從哪里使用biomart提取此基因名稱(並給定rs號)? 先感謝您。
PS:我需要對500個條目(而不只是1個)執行此操作。 因此,為什么我如上所述創建了一個簡單的函數來提取基因名稱。
首先,我認為您的問題將在https://www.biostars.org/上引起更多專業關注
就是說,據我所知,現在您有了集成ID(ENSG00000061337),離獲取基因名稱僅一步之遙。 如果您用谷歌“如何將集成體ID轉換為基因名稱”,您會發現很多方法。 在這里,我列出了一些選項:
祝好運
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.