簡體   English   中英

R腳本從KEGG獲取路徑而不使用任何包

[英]R script to fetch pathway from KEGG without using any package

我正在為文本挖掘創建一個R包,我想在包中添加一個函數來獲取KEGG的路徑列表。 我可以從wikipathways獲取路徑,但無法從KEGG獲取。 請建議我如何在沒有像NBCI2R等其他包裹的情況下從KEGG獲取路徑,我想制作我自己的功能所以請幫助我。

謝謝

在繼續這個回答之前,我強烈建議您閱讀http://www.kegg.jp/kegg/legal.html KEGG僅供學術使用,您需要適當的許可才能為服務提供API /庫。 所以很可能你想要一個非匿名訪問ftp://ftp.genome.jp/ ,需要這樣的許可證。

但是,關於您的實際問題,您可以在http://www.kegg.jp/kegg-bin/download_htext?htext=br08901.keg&format=htext下找到所有路徑的平面文件。 只需下載並解析它:

lines <- readLines(
  "http://www.kegg.jp/kegg-bin/download_htext?htext=br08901.keg&format=htext" )
pathways <- do.call(
   rbind,
   str_split( grep( "^[ABCD]\\s+\\d{5}\\s+.*?$", lines, value=TRUE ), "\\s{2,}" )
)
pathways <- as.data.frame( pathways )[-1]
colnames( pathways )  <- c( "ID", "Name" )

head(pathways)

     ID                                         Name
1 01100                           Metabolic pathways
2 01110        Biosynthesis of secondary metabolites
3 01120 Microbial metabolism in diverse environments
4 00010                 Glycolysis / Gluconeogenesis
5 00020                    Citrate cycle (TCA cycle)
6 00030                    Pentose phosphate pathway

請注意,這也可能僅用於非商業目的。 但是,版權未說明非瀏覽器軟件是否可以訪問該網站用於非商業用途。 所以,如果沒有聯系他們,你不要過於廣泛地嘗試這一點。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM