[英]Is there a R code set to use PubMed ID or DOI to get data files for that article, please?
我正在嘗試使用R語言從NCBI或PubMed獲取與數百個唯一的DOI或PMID相關或附加的數據文件名。 例如。 我的PMID:19122651,我想獲取與其連接的三個GSE的名稱,分別是:GSE12781,GSE12782和GSE12783。 我搜索了各種資源和軟件包,無濟於事。
感謝您的協助。
您可以使用rentrez軟件包進行此操作。
所需的功能是entrez_link 。
例:
library(rentrez)
results <- entrez_link(dbfrom = 'pubmed', id = 19122651, db = 'gds')
results$links$pubmed_gds
[1] "200012783" "200012782" "200012781"
這3個結果是關聯的GEO數據集記錄的ID。 您可以使用entrez_summary
將它們轉換為GSE加入。
這是一個有點丑陋的應用sapply
,可以用作函數的基礎:
sapply(results$links$pubmed_gds, function (id) entrez_summary("gds", id)$accession,
USE.NAMES = FALSE)
[1] "GSE12783" "GSE12782" "GSE12781"
您可以通過查詢NCBI rentrez
所描述的包在這里 。 函數entrez_link()
應該能夠找到交叉引用
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.