如何根据多个现有列中的数据对新列使用 mutate

Question

早上好，

这是我的数据集，包含不同客户种族的数据。

White  Asian  Black  Native  Islander  Other
1       0       0      0       0         0
0       1       0      0       0         0
0       0       0      1       0         0
0       0       1      0       0         0
1       0       0      0       1         0
0       0       0      0       0         1

数据以布尔值存储，其中 0 = 否，1 = 是

因此，如果客户的列白色为 1，则它们是白色的。

但是，如果客户对白人和岛民的评分为 1，那么他们就是多种族。

所以这将是我想要的输出

White  Asian  Black  Native  Islander  Other   Race
1       0       0      0       0         0     White
0       1       0      0       0         0     Asian
0       0       0      1       0         0     Native
0       0       1      0       0         0     Black
1       0       0      0       1         0     Multi-Racial 
0       0       0      0       0         1     Other

我熟悉 mutate() 但我只使用了基于一列的 mutate。

任何人都可以提供可以帮助我获得所需输出的代码吗？

Answer 1

使用ifelse()和max.col()应该可以得到你想要的。 对于只有一个值的行，您索引该值所在的名称，否则为"Multi-Racial"

df1$Race <- ifelse(rowSums(df1) == 1, names(df1)[max.col(df1)], "Multi-Racial")
df1
  White Asian Black Native Islander Other         Race
1     1     0     0      0        0     0        White
2     0     1     0      0        0     0        Asian
3     0     0     0      1        0     0       Native
4     0     0     1      0        0     0        Black
5     1     0     0      0        1     0 Multi-Racial
6     0     0     0      0        0     1        Other

或者，使用mutate() ：

df1 %>%
  mutate(Race = ifelse(rowSums(.) == 1, names(.)[max.col(.)], "Multi-Racial"))

数据：

df1 <- read.table(header = T, text = "White  Asian  Black  Native  Islander  Other
1       0       0      0       0         0
0       1       0      0       0         0
0       0       0      1       0         0
0       0       1      0       0         0
1       0       0      0       1         0
0       0       0      0       0         1")

如何根据多个现有列中的数据对新列使用 mutate

问题描述

1 个解决方案

解决方案1
2 已采纳 2020-02-27 16:29:20

如何根据多个现有列中的数据对新列使用 mutate

问题描述

1 个解决方案

解决方案1 2 已采纳 2020-02-27 16:29:20

解决方案1
2 已采纳 2020-02-27 16:29:20