[英]how can I set a dummy variable in a regression in R
以下是我的数据
y r1 r2 r3
1 0.1 0.2 -0.3
2 0.7 -0.9 0.03
3 -0.93 -0.32 -0.22
1.第一个问题是我怎样才能得到这样的输出:
y r1 r2 r3 dummy_r1 dummy_r2 dummy_r3
1 0.1 0.2 -0.3 0 0 1
2 0.7 -0.9 0.03 0 1 0
3 -0.93 -0.32 -0.22 1 1 1
注:我要负数为1,正数为0
2.第二个问题是,如果我想做这样的回归: lm(y~r1+r2+r3+dummy_r1+ dummy_r2+dummy_r3)
,如果我不想使用输出data(dummy_r1,dummy_r2,dummy_r3)
上面,因为不方便。
使用末尾注释中可重现的DF
,将DF2
定义为也具有sign.*
列,然后对其运行回归。 当然,您在问题中没有足够的数据来实际获得这么多预测变量的系数,但是如果在您的实际问题中您有更多数据,那么应该没问题。
DF2 <- cbind(DF, sign = +(DF[-1] < 0))
lm(y ~., DF2)
给予:
Call:
lm(formula = y ~ ., data = DF2)
Coefficients:
(Intercept) r1 r2 r3 sign.r1
1.425 -1.163 -1.543 NA NA
sign.r2 sign.r3
NA NA
Lines <- "y r1 r2 r3
1 0.1 0.2 -0.3
2 0.7 -0.9 0.03
3 -0.93 -0.32 -0.22"
DF <- read.table(text = Lines, header = TRUE)
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.