簡體   English   中英

是否設置了R代碼以使用PubMed ID或DOI獲取該文章的數據文件?

[英]Is there a R code set to use PubMed ID or DOI to get data files for that article, please?

我正在嘗試使用R語言從NCBI或PubMed獲取與數百個唯一的DOI或PMID相關或附加的數據文件名。 例如。 我的PMID:19122651,我想獲取與其連接的三個GSE的名稱,分別是:GSE12781,GSE12782和GSE12783。 我搜索了各種資源和軟件包,無濟於事。
感謝您的協助。

您可以使用rentrez軟件包進行此操作。

所需的功能是entrez_link

例:

library(rentrez)

results <- entrez_link(dbfrom = 'pubmed', id = 19122651, db = 'gds')

results$links$pubmed_gds
[1] "200012783" "200012782" "200012781"

這3個結果是關聯的GEO數據集記錄的ID。 您可以使用entrez_summary將它們轉換為GSE加入。

這是一個有點丑陋的應用sapply ,可以用作函數的基礎:

sapply(results$links$pubmed_gds, function (id) entrez_summary("gds", id)$accession, 
       USE.NAMES = FALSE)

[1] "GSE12783" "GSE12782" "GSE12781"

您可以通過查詢NCBI rentrez所描述的包在這里 函數entrez_link()應該能夠找到交叉引用

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM