[英]Nothing Returning When Using rvest and xpath on an html page
我正在使用xpath和rvest抓取htm頁面。 rvest的其他示例在管道中也可以很好地工作,但是對於此特定腳本,不會返回任何內容。
webpage <- read_html("https://www.sec.gov/litigation/admin/34-45135.htm")
whomst <- webpage %>% html_nodes(xpath = '/html/body/table[2]/tbody/tr/td[3]/font/p[1]/table/tbody/tr/td[1]/p[2]')
返回的是:
{xml_nodeset (0)}
這是頁面和相應html的屏幕截圖
這是我訪問的頁面: https : //www.sec.gov/litigation/admin/34-45135.htm 。 我正在嘗試提取“ PINNACLE HOLDINGS,INC。”一詞。
有時chrome工具無法提供准確的xpath或CSS,您需要自己嘗試一下,此選擇器有效:
webpage %>% html_nodes("td > p:nth-child(3)") %>% html_text()
結果:
[1] "PINNACLE HOLDINGS, INC., \n
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.