簡體   English   中英

如何將原始數據框中的列添加到抓取的數據中?

[英]How do I add column from an original dataframe to scraped data?

我有兩列“名稱”和“鏈接”,表示公司名稱和要從中抓取的鏈接。 我如何放回名稱列,以便每行抓取的數據都有一個包含相應公司名稱的列?

List.Of.Tabs <- map(pages, ~ {
  name <- .x[1]
  link <- .x[2]
  webpage <- read_html(link)
  tbls <- html_nodes(webpage, "table")
  tbls_ls <- html_table(tbls,fill = TRUE)
  pos1 <- possibly(function(tbls) bind_rows(tbls) %>% 
                   filter_all(any_vars(. %in% c("Ireland", "Japan")))
                   , otherwise = NA)
  pos1(tbls_ls)

結果應該是這樣的:

results <- data.frame(subsidiaries = c('Microsoft Japan','Microsoft Ireland'), 
                      country = c('Japan', 'Ireland'),
                      name = c('Microsoft','Microsoft'))

根據代碼,我們可能需要mutate (即從第一行代碼中已經創建的“名稱”創建一個“名稱”列)

List.Of.Tabs <- map(pages, ~ {
  name <- .x[1]
  link <- .x[2]
  webpage <- read_html(link)
  tbls <- html_nodes(webpage, "table")
  tbls_ls <- html_table(tbls,fill = TRUE)
  pos1 <- possibly(function(tbls) bind_rows(tbls) %>% 
                   filter_all(any_vars(. %in% c("Ireland", "Japan"))) %>%
                   mutate(name = name) # changed here
                   , otherwise = NA)
  pos1(tbls_ls)

  })

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM