簡體   English   中英

在html頁面上使用rvest和xpath時什么也沒有返回

[英]Nothing Returning When Using rvest and xpath on an html page

我正在使用xpath和rvest抓取htm頁面。 rvest的其他示例在管道中也可以很好地工作,但是對於此特定腳本,不會返回任何內容。

    webpage <- read_html("https://www.sec.gov/litigation/admin/34-45135.htm")
    whomst <- webpage %>% html_nodes(xpath = '/html/body/table[2]/tbody/tr/td[3]/font/p[1]/table/tbody/tr/td[1]/p[2]') 

返回的是:

   {xml_nodeset (0)}

這是頁面和相應html的屏幕截圖

屏幕抓圖

這是我訪問的頁面: https : //www.sec.gov/litigation/admin/34-45135.htm 我正在嘗試提取“ PINNACLE HOLDINGS,INC。”一詞。

有時chrome工具無法提供准確的xpath或CSS,您需要自己嘗試一下,此選擇器有效:

webpage %>% html_nodes("td > p:nth-child(3)") %>% html_text()

結果:

[1] "PINNACLE HOLDINGS, INC.,   \n    

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM