繁体   English   中英

在表中添加观察并赋予给定观察的属性(连接)

[英]Adding observations in a table and attribute a given observation (join)

下午好,

我正在分析给定月份的观察分布,例如:

日期观察

2010-01 10

2010-03 15

2010-05 16

问题:如何在表中插入缺失的日期(2010-02 和 2010-05)(使用包含所有月度日期的其他表)并将 0 属性作为观察值。

提前致谢。

我们将“日期”转换为Date class,然后使用complete的数据集扩展数据集,方法是获取min/maxfirstlast “日期” by “1 个月”,同时用 0 fill “观察”

library(tidyr)
library(dplyr)
df1 %>%
     mutate(Date = as.Date(Date)) %>%
     complete(Date = seq(first(Date), last(Date), by = '1 month'), 
            fill = list(Observations = 0))

如果有另一个具有完整“日期”的数据集,那么显而易见的选项是left_join ,然后将“观察”中的NA元素替换为 0,因为默认情况下,如果我们没有匹配项,它将用NA填充

left_join(df2, df1, by = 'Date') %>%
     mutate(Observations = replace_na(Observations, 0))

注意: df2是具有完整“日期”的数据集

如果'df2'还有其他列,我们不需要select这些列

left_join(df2 %>% 
               select(Date), df1) %>%
     mutate(Observations = replace_na(Observations, 0))

base R中,我们可以使用merge

transform(merge(df2, df1, by = 'Date', all.x = TRUE),
      Observations = replace(Observations, is.na(Observations), 0))

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM