將 `xml_document/xml_node` 對象保存在 tibble 中以進行變異

Question

我想將一個 html 頁面保存到一個 tibble 中，以便我以后可以在頁面內容上使用 mutate

我想過將 html 直接讀到 tibble：

library(tidyverse)
library(rvest)

#does not work
tibble(html=read_html("https://www.accessdata.fda.gov/scripts/cder/daf/index.cfm?event=overview.process&ApplNo=040445"))
#> Error: All columns in a tibble must be vectors.
#> x Column `html` is a `xml_document/xml_node` object.

作為list閱讀有效：

#works
works <- tibble(html=list(read_html("https://www.accessdata.fda.gov/scripts/cder/daf/index.cfm?event=overview.process&ApplNo=040445")))
works
#> # A tibble: 1 x 1
#>   html      
#>   <list>    
#> 1 <xml_dcmn>

但是，我不能使用mutate ：

# does not work
works %>% 
  mutate(table=html_nodes(unlist(page),"#exampleApplSuppl"))
#> Error: Problem with `mutate()` column `table`.
#> i `table = html_nodes(unlist(page), "#examleApplSuppl")`.

^{由reprex 包(v2.0.1) 於 2021 年 11 月 2 日創建}

Answer 1

作為“HTML”列list ，環比list ，並在返回輸出list

library(purrr)
library(dplyr)
works %>% 
   mutate(table = map(html, ~ html_nodes(.x, "#examleApplSuppl")))

-輸出

# A tibble: 1 × 2
  html       table     
  <list>     <list>    
1 <xml_dcmn> <xml_ndst>

將 `xml_document/xml_node` 對象保存在 tibble 中以進行變異

問題描述

1 個解決方案

解決方案1
1 已采納 2021-11-02 19:55:06

將 `xml_document/xml_node` 對象保存在 tibble 中以進行變異

問題描述

1 個解決方案

解決方案1 1 已采納 2021-11-02 19:55:06

解決方案1
1 已采納 2021-11-02 19:55:06