如何在 r 中改变具有不同条件的新变量

Question

说我有一个df 。

df = data.frame(status = c(1, 0, 0, 0, 1, 0, 0, 0),
                stratum = c(1,1,1,1, 2,2,2,2),
                death = 1:8)

> df
  status stratum death
1      1       1     1
2      0       1     2
3      0       1     3
4      0       1     4
5      1       2     5
6      0       2     6
7      0       2     7
8      0       2     8

我想改变一个名为weights的新变量。 并且应满足以下条件：

weights应该在stratum组中发生突变。
当status为1时， weights值应返回death值。

我期望的应该是这样的：

df_wanted =  data.frame(status = c(1, 0, 0, 0, 1, 0, 0, 0),
                        stratum = c(1,1,1,1, 2,2,2,2),
                        death = 1:8,
                        weights = c(1,1,1,1, 5,5,5,5))

> df_wanted
  status stratum death weights
1      1       1     1       1
2      0       1     2       1
3      0       1     3       1
4      0       1     4       1
5      1       2     5       5
6      0       2     6       5
7      0       2     7       5
8      0       2     8       5

我不知道如何编写代码。

任何帮助将不胜感激！

Answer 1

您可能会在status = 1处获得death值。

library(dplyr)

df %>%
  group_by(stratum) %>%
  mutate(weights = death[status == 1]) %>%
  ungroup

上述方法有效，因为在status = 1的每个组中恰好有 1 个值。 如果在status = 1的组中有 0 个或超过 1 个值，则更好的选择是使用match ，它将为 0 值返回NA并为超过 1 个值返回第一个death值。

df %>%
  group_by(stratum) %>%
  mutate(weights = death[match(1, status)]) %>%
  ungroup

#  status stratum death weights
#   <dbl>   <dbl> <int>   <int>
#1      1       1     1       1
#2      0       1     2       1
#3      0       1     3       1
#4      0       1     4       1
#5      1       2     5       5
#6      0       2     6       5
#7      0       2     7       5
#8      0       2     8       5

如何在 r 中改变具有不同条件的新变量

问题描述

1 个解决方案

解决方案1
1 已采纳 2021-12-30 04:59:53

如何在 r 中改变具有不同条件的新变量

问题描述

1 个解决方案

解决方案1 1 已采纳 2021-12-30 04:59:53

解决方案1
1 已采纳 2021-12-30 04:59:53