將條件應用於R中的多個列

Question

我有一個數據集，它以虛擬變量的形式代表每個客戶的一個籃子。

例如：

P1  P2  P3  P4  P5
0   2   0   0   0
0   1   0   0   0
0   0   0   3   0 
0   0   0   0   0
0   0   5   0   0
1   1   0   0   0

其中P1代表產品1，依此類推。

本質上，我想運行一個簡單的查詢，在其中我可以轉換所有超過1到1的值。這樣我的數據中只有1和0。 我能夠使用以下幾行來完成它：

df[(df$P1>1] <- 1

是否適用所有功能？

Answer 1

您可以轉換為邏輯矩陣，並通過用+包裝來強制轉換為二進制。

+(df > 0)
#     P1 P2 P3 P4 P5
#[1,]  0  1  0  0  0
#[2,]  0  1  0  0  0
#[3,]  0  0  0  1  0
#[4,]  0  0  0  0  0
#[5,]  0  0  1  0  0
#[6,]  1  1  0  0  0

或使用略慢的ifelse

ifelse(df > 0, 1, 0)

如果數據集非常大，則創建matrix可能無法提高內存效率。 我們可以轉換為data.table （假設初始數據集是data.frame ）並使用set將值更改為1

library(data.table)
setDT(df)
for(j in seq_along(df)){
  set(df, i= which(df[[j]] > 1), j=j, value=1)
 }

df
#   P1 P2 P3 P4 P5
#1:  0  1  0  0  0
#2:  0  1  0  0  0
#3:  0  0  0  1  0
#4:  0  0  0  0  0
#5:  0  0  1  0  0
#6:  1  1  0  0  0

Answer 2

這應該與您嘗試的相同：

df[df > 0] <- 1
df
  P1 P2 P3 P4 P5
1  0  1  0  0  0
2  0  1  0  0  0
3  0  0  0  1  0
4  0  0  0  0  0
5  0  0  1  0  0
6  1  1  0  0  0

Answer 3

為什么不和class一起玩：

`class<-`(!!df, "numeric")

#     P1 P2 P3 P4 P5
#[1,]  0  1  0  0  0
#[2,]  0  1  0  0  0
#[3,]  0  0  0  1  0
#[4,]  0  0  0  0  0
#[5,]  0  0  1  0  0
#[6,]  1  1  0  0  0

將條件應用於R中的多個列

問題描述

3 個解決方案

解決方案1
6 2015-09-30 14:23:07

解決方案2
2 2015-09-30 14:32:18

解決方案3
1 2015-09-30 14:43:46

將條件應用於R中的多個列

問題描述

3 個解決方案

解決方案1 6 2015-09-30 14:23:07

解決方案2 2 2015-09-30 14:32:18

解決方案3 1 2015-09-30 14:43:46

解決方案1
6 2015-09-30 14:23:07

解決方案2
2 2015-09-30 14:32:18

解決方案3
1 2015-09-30 14:43:46