簡體   English   中英

使用 R 進行網頁抓取,用於多頁循環

[英]Webscraping with R For Loop of Multiple Pages

我正在嘗試 web 抓取維也納房地產的位置,對於一頁它正在工作但對於多個不:

library(rvest)
library(dplyr)

link <- "https://www.immobilienscout24.at/regional/wien/wien/immobilie-kaufen/seite-4"
page <- read_html(link)

location <- page %>% html_elements(".YqNih") %>% html_text()

flat <- data.frame(location, stringsAsFactors = FALSE)

但是,for 循環不會返回應有的頁面:

library(rvest)
library(dplyr)

flat_II = data.frame()

for (i in 2:20) {
  link <- paste0("https://www.immobilienscout24.at/regional/wien/wien/immobilie-kaufen/seite-", i)
  page <- read_html(link)
  
  location <- page %>% html_element(".YqNih") %>% html_text()
  
  flat_II = rbind(flat_II, data.frame(location, stringsAsFactors = FALSE))
  print(paste("Page:", i))

似乎 ID 在第 6 頁從 YqNih 更改為 gTYeB。我沒有進一步檢查。 如果你想要頁面上的所有地址,你可能想試試這一行:

  location <- page %>% html_nodes("address") %>% html_text()

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM