[英]How to retrieve from Ensembl of a gene's start and end values on a chromosome
假設我有一個名為“Tlr6”的基因(見下圖),我想知道如何在RI中檢索染色體上基因的起始值和終止值? 例如,在圖片中,起始值為64952031,結束值為64960097。
圖片的URL在這里 。 這里的基因名稱是Tlr6
,Ensembl ID是ENSMUSG00000051498
。 我可以使用這些信息將起始值和結束值讀入R嗎?
您可以使用Bioconductor
的biomaRt
包來執行此操作:
#skip this if the package is already installed
source("http://bioconductor.org/biocLite.R")
biocLite("biomaRt")
library(biomaRt)
#select the ensembl mouse dataset
ensembl <- useMart("ensembl", dataset="mmusculus_gene_ensembl")
getBM(attributes=c("ensembl_gene_id","start_position","end_position"),
filters="ensembl_gene_id",values = "ENSMUSG00000051498",mart=ensembl)
關於包的更多信息這里 。
你是這個意思嗎?
> Tlr6 <- "64.952.031-64.960.097"
> c(gsub("\\.", "", substr(Tlr6, 1, 10)), gsub("\\.", "", substr(Tlr6, 12, 21)))
[1] "64952031" "64960097"
或者您是否在詢問如何從網頁中獲取初始值?
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.