繁体   English   中英

将url表转换为`data.frame` R-XML-RCurl

[英]get url table into a `data.frame` R-XML-RCurl

我正在尝试将url表放入data.frame 在其他示例中,我发现以下代码有效:

library(XML)
library(RCurl)
theurl <- "https://es.finance.yahoo.com/q/cp?s=BEL20.BR"
tables <- readHTMLTable(theurl)

正如警告所说,该表似乎不是XML

Warning message: XML content does not seem to be XML: 'https://es.finance.yahoo.com/q/cp?s=BEL20.BR'

或者, getURLContent(theurl, ssl.verifypeer = FALSE, useragent = "R")有效,但不知道如何提取表。 任何帮助,将不胜感激。

编辑:感谢@ har07使用table <- readHTMLTable(getURLContent(theurl, ssl.verifypeer = FALSE, useragent = "R"))$ yfncsumtab给出输出但仍需要过滤。

如果使用getURL获取文档内容,则可以获取该表。 有时readHTMLTable无法获取内容。 在这些情况下,建议尝试getURL

> library(XML)
> library(RCurl)
> URL <- getURL("https://es.finance.yahoo.com/q/cp?s=BEL20.BR")
> rt <- readHTMLTable(URL, header = TRUE)
> rt

您可能需要调整header参数以及可能的其他参数,但表格就在那里。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM