循環創建虛擬變量R.

Question

我試圖使用基於變量的最頻繁響應的循環來生成虛擬變量（必須是1/0）。 經過大量的谷歌搜索，我還沒有設法找到解決方案。 我已經提取了最頻繁的響應（字符串，比如說前五名是“A”，“B”，......，“E”）

top5<-names(head(sort(table(data$var1), decreasing = TRUE),5)

我想循環檢查另一個變量（“var2”）是否等於A，如果這樣設置= 1，OW = 0，然后使用aggregate（）給出摘要。 在Stata中，我可以使用`i'來引用循環變量，但不能在R中引用...不起作用的代碼是：

for(i in top5) {
   data$i.dummy <- ifelse(data$var2=="i",1,0)
   aggregate(data$i.dummy~data$age+data$year,data,mean)
}

有什么建議么？

Answer 1

如果你想在你的前5名每件一列，然后我會用sapply沿元素top5 。 不需要ifelse因為==比較並且如果比較為TRUE則給出TRUE或1，否則為0

在這里，我們cbind 5列，矩陣，其每一對的每個元素的一個top5含有1如果在該行data$var2等於“TOP5”的相應的元件：

data <- cbind( data , sapply( top5 , function(x) as.integer( data$var2 == x ) ) )

如果你想要一個列匹配任何top5匹配，那就更容易了：

data$dummies <- as.integer( data$var2 %in% top5 )

兩種情況下的as.integer()分別用於將TRUE或FALSE變為1和0 。

一個簡短的例子來說明它是如何工作的：

set.seed(123)
top2 <- c("A","B")
data <- data.frame( var2 = sample(LETTERS[1:4],6,repl=TRUE) )

#  Make dummy variables, one column for each element in topX vector
data <- cbind( data , sapply( top2 , function(x) as.integer( data$var2 == x ) ) )
data
#  var2 A B
#1    B 0 1
#2    D 0 0
#3    B 0 1
#4    D 0 0
#5    D 0 0
#6    A 1 0

#  Make single column for all elements in topX vector
data$ANY <- as.integer( data$var2 %in% top2 )
data
#  var2 ANY A B
#1    B   1 0 1
#2    D   0 0 0
#3    B   1 0 1
#4    D   0 0 0
#5    D   0 0 0
#6    A   1 1 0

Answer 2

看到fortune(312) ，然后閱讀幫助?"[["可能是paste0的幫助。

然后可能考慮使用其他工具，如model.matrix和sapply而不是自己使用循環。

循環創建虛擬變量R.

問題描述

2 個解決方案

解決方案1
5 已采納 2013-06-12 16:59:20

解決方案2
5 2013-06-12 18:14:27

循環創建虛擬變量R.

問題描述

2 個解決方案

解決方案1 5 已采納 2013-06-12 16:59:20

解決方案2 5 2013-06-12 18:14:27

解決方案1
5 已采納 2013-06-12 16:59:20

解決方案2
5 2013-06-12 18:14:27