[英]R Error using readHTMLTable
我使用以下代码:
url = "http://finance.yahoo.com/q/op?s=DIA&m=2013-07"
library(XML)
tabs = readHTMLTable(url, stringsAsFactors = F)
我收到以下错误:
Error: failed to load external entity "http://finance.yahoo.com/q/op?s=DIA&m=2013-07"
当我在浏览器中使用url时,它工作正常。 那么,我在这里做错了什么?
谢谢
很难确切地知道,因为我无法复制你的错误,但根据包的作者(参见http://comments.gmane.org/gmane.comp.lang.r.mac/2284),XML的获取方法内容非常简约。 解决方法是使用RCurl
获取内容和XML
来解析它:
library(XML)
library(RCurl)
url <- "http://finance.yahoo.com/q/op?s=DIA&m=2013-07"
tabs <- getURL(url)
tabs <- readHTMLTable(tabs, stringsAsFactors = F)
或者,如果RCurl
仍然抛出错误,请尝试httr
包:
library(httr)
tabs <- GET(url)
tabs <- readHTMLTable(rawToChar(tabs$content), stringsAsFactors = F)
我在使用url时遇到了与上面“无法加载外部实体”相同的错误< - “ http://www.cisco.com/c/en/us/products/a-to-z-series-index.html “doc < - htmlTreeParse(url,useInternal = TRUE)
我遇到了这个和另一个关于这个主题的帖子,这个帖子没有解决我的问题。 此代码以前有效。 然后我意识到我在公司VPN上。 我下了VPN并重新尝试了它的工作原理。 因此,在VPN上可能是您获得上述错误的另一个原因。 离开VPN解决了它。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.