[英]Reading mixed-format dates
如果一列日期包含两种不同的格式,是否有一种方法可以解析这两种格式,以便我得到 2012-04-01 的 2 行而不是下面的结果?
# A tibble: 2 x 1
date
<date>
1 2012-04-01
2 NA
**Example Code**
library(tidyverse)
data <- read_csv("date\n01/04/12\n41000", col_types = cols_only("date" = col_date("%d/%m/%y")))
head(data)
您可以尝试如下操作,而不是在读取数据时强制使用日期数据类型:
data <- read_csv("date\n01/04/12\n41000")
data %>% mutate(date =ifelse(is.numeric(date), as.Date(date, origin = "1990-01-01"), date))
尽管可能不是最优雅的解决方案,但此解决方案似乎可行:
library(tidyverse)
library(lubridate)
data <- read_csv("date,text\n01/04/12,a\n41000,b\n02/02/13,c")
data <- data %>%
mutate(date1 = as_date(as.numeric(date), origin = "1899-12-30")) %>%
mutate(date2 = as_date(date, "%d/%m/%y")) %>%
mutate(date3 = if_else(is.na(date1), date2, date1))
head(data)
janitor::convert_to_date
处理 Excel 数值和日期格式日期的混合。
library(tidyverse)
library(janitor)
data <- read_csv("date,text\n01/04/12,a\n41000,b\n02/02/13,c")
data %>%
mutate(clean_date = convert_to_date(date,
character_fun = lubridate::dmy))
#> # A tibble: 3 x 3
#> date text clean_date
#> <chr> <chr> <date>
#> 1 01/04/12 a 2012-04-01
#> 2 41000 b 2012-04-01
#> 3 02/02/13 c 2013-02-02
自我宣传免责声明:我编写了这个包。 但是这个函数正是为这个用例而构建的,所以在这里发布感觉很重要。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.