滿足條件的子集列

Question

我的任務：

選擇行為0或1的所有列。
將所有這些列的類更改為階乘（因為它們是二進制的）。

在以下情況下，CA + CC應更改為factorial 。

CA = c(1,0,1,0,1)
CB = c(1,12,21,0,7)
CC = c(1,0,1,0,1)
mydf = data.frame(CA, CB, CC)
str(mydf)
    'data.frame':   5 obs. of  3 variables:
     $ CA: num  1 0 1 0 1
     $ CB: num  1 12 21 0 7
     $ CC: num  1 0 1 0 1

為什么？ 因為這些行當前被描述為integer和number而不是factors 。 而且我假設某些機器學習算法會把事情混在一起。

Answer 1

使用baseR的一種方法：

#if all the values in a column are either 0 or 1 convert to factor
mydf[] <- lapply(mydf, function(x) {
  if(all(x %in% 0:1)) {
    as.factor(x)
  } else {
    x
  }
})

出：

str(mydf)
#'data.frame':  5 obs. of  3 variables:
# $ CA: Factor w/ 2 levels "0","1": 2 1 2 1 2
# $ CB: num  1 12 21 0 7
# $ CC: Factor w/ 2 levels "0","1": 2 1 2 1 2**

Answer 2

dplyr的mutate_if另一種方法

library(dplyr) 
is_one_zero <- function(x) {

  res <- all(unique(x) %in% c(1, 0))

  return(res)
}

out <- mydf %>% 
  mutate_if(is_one_zero, as.factor) 

str(out)
#'data.frame':  5 obs. of  3 variables:
# $ CA: Factor w/ 2 levels "0","1": 2 1 2 1 2
# $ CB: num  1 12 21 0 7
# $ CC: Factor w/ 2 levels "0","1": 2 1 2 1 2

Answer 3

這是在R基中執行此操作的另一種方法

cols <- colSums(mydf == 0 | mydf == 1) == nrow(mydf)
mydf[cols] <- lapply(mydf[cols], as.factor)

str(mydf)
#'data.frame':  5 obs. of  3 variables:
# $ CA: Factor w/ 2 levels "0","1": 2 1 2 1 2
# $ CB: num  1 12 21 0 7
# $ CC: Factor w/ 2 levels "0","1": 2 1 2 1 2

滿足條件的子集列

問題描述

3 個解決方案

解決方案1
2 2019-03-21 10:04:13

解決方案2
2 已采納 2019-03-21 10:04:57

解決方案3
2 2019-03-21 10:53:51

滿足條件的子集列

問題描述

3 個解決方案

解決方案1 2 2019-03-21 10:04:13

解決方案2 2 已采納 2019-03-21 10:04:57

解決方案3 2 2019-03-21 10:53:51

解決方案1
2 2019-03-21 10:04:13

解決方案2
2 已采納 2019-03-21 10:04:57

解決方案3
2 2019-03-21 10:53:51