簡體   English   中英

R中的Biomart將rssnp轉換為基因名稱

[英]Biomart in R to convert rssnp to gene name

我在R中有以下代碼。

library(biomaRt)

snp_mart = useMart("ENSEMBL_MART_SNP", dataset="hsapiens_snp")
snp_attributes = c("refsnp_id", "chr_name", "chrom_start", 
"associated_gene", "ensembl_gene_stable_id", "minor_allele_freq")

getENSG <- function(rs, mart = snp_mart) {
results <- getBM(attributes = snp_attributes,
               filters    = "snp_filter", values = rs, mart = mart)
return(results)
}

getENSG("rs144864312")

    refsnp_id chr_name chrom_start associated_gene ensembl_gene_stable_id
1 rs144864312        8    20254959              NA        ENSG00000061337
    minor_allele_freq
1       0.000399361

我沒有生物學背景,因此,如果這是一個明顯的問題,請原諒我。 有人告訴我rs144864312應該與基因名稱“ LZTS1”匹配。 上面的代碼主要來自互聯網。 我的問題是我從哪里提取該基因名稱? 我知道listAttributes(snp_mart)給出了所有可能輸出的列表,但是我看不到任何給我上述“基因名稱”的東西。 我該從哪里使用biomart提取此基因名稱(並給定rs號)? 先感謝您。

PS:我需要對500個條目(而不只是1個)執行此操作。 因此,為什么我如上所述創建了一個簡單的函數來提取基因名稱。

首先,我認為您的問題將在https://www.biostars.org/上引起更多專業關注

就是說,據我所知,現在您有了集成ID(ENSG00000061337),離獲取基因名稱僅一步之遙。 如果您用谷歌“如何將集成體ID轉換為基因名稱”,您會發現很多方法。 在這里,我列出了一些選項:

  1. 使用: https : //david.ncifcrf.gov/conversion.jsp
  2. 在集成環境下使用biomart: http ://www.ensembl.org/biomart/martview/1cb4c119ae91cb34b2cd5280be0a1aac
  3. 下載具有基因名稱和整合ID的表格,然后自定義查詢。 您可能要從UCSC Genome Browser下載它,以下是一些說明: https : //www.biostars.org/p/92939/

祝好運

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM