创建基于条件标记行的新列

Question

我正在尝试过滤称为df数据df

structure(list(ï..ID = structure(c(2L, 1L, 4L, 6L, 3L, 7L, 5L, 
8L), .Label = c("Jay ", "Jim", "Jim ", "John ", "Mike ", "Peter", 
"Peter ", "Tom"), class = "factor"), Target1 = structure(c(8L, 
4L, 6L, 5L, 2L, 1L, 3L, 7L), .Label = c("Andreas", "Cheyne", 
"Frank", "John", "Mickey", "Raj", "Sarah", "Timothy"), class = "factor"), 
    Target2 = structure(c(4L, 3L, 1L, 5L, 2L, 1L, 1L, 1L), .Label = c("", 
    "Jake", "Peter", "Timothy ", "Tommy "), class = "factor"), 
    Parter1 = structure(c(3L, 2L, 1L, 1L, 1L, 1L, 1L, 1L), .Label = c("", 
    "Mike ", "Timothy"), class = "factor"), Parter2 = structure(c(1L, 
    2L, 1L, 1L, 1L, 1L, 1L, 1L), .Label = c("", "Peter"), class = "factor")), class = "data.frame", row.names = c(NA, 
-8L))

我试图过滤数据框，以便如果出现在此向量x的名称

x=c("Raj", "Timothy")

在第2-5列中显示2次以上，该行将具有一个全新的变量，称为flag ，如果名称显示2次以上，则flag = 1；如果名称显示2次以上，则flag = 0。

Answer 1

在Base R中，我们可以使用apply ， MARGIN = 1 （逐行）

df$flag <- as.integer(apply(df, 1, function(row) sum(row %in% x)) > 2)

df
#  ï..ID Target1 Target2 Parter1 Parter2 flag
#1   Jim Timothy Timothy Timothy            1
#2   Jay    John   Peter    Mike   Peter    0
#3  John     Raj                            0
#4 Peter  Mickey   Tommy                    0
#5   Jim  Cheyne    Jake                    0
#6 Peter Andreas                            0
#7  Mike   Frank                            0
#8   Tom   Sarah                            0

apply将数据帧转换为矩阵，可能会变慢一些时间。 您可以避免使用具有相同逻辑的sapply进行apply调用

df$flag <- as.integer(sapply(1:nrow(df), function(i) sum(df[i, ] %in% x)) > 2)

另一种写法

df$flag <- as.integer(colSums(sapply(1:nrow(df), function(i) df[i, ] %in% x)) > 2)

PS-名称中有一些空格，我必须先运行

df[] <- lapply(df, trimws)

删除它们。

创建基于条件标记行的新列

问题描述

1 个解决方案

解决方案1
1 已采纳 2019-01-31 04:58:52

创建基于条件标记行的新列

问题描述

1 个解决方案

解决方案1 1 已采纳 2019-01-31 04:58:52

解决方案1
1 已采纳 2019-01-31 04:58:52