[英]Regression of dummy variables in R
我是R的新手,我正在尝试对我的数据集执行回归,其中包括多年来不同国家的公司的月度销售数据。
在其他统计程序中,为了控制销售的季度周期性变动以及区域(国家)差异,我将创建虚拟变量,表明销售的季度和国家。
我的问题:
1)我在R中看到你可以将变量类型设置为'Factor'。 在这种情况下,我是否仍然需要创建指示国家和月/季度的虚拟变量,或者R是否已经不同地处理因子变量并且在后台自动将它们转换为虚拟变量?
2)如果上面的情况并非如此,而且我确实需要将我的值重新编码为0个假人,那么在R中有一个简洁的标准方法吗?
非常感谢您的帮助,祝您度过愉快的一天!
Trgovec
R将自动从您的公式创建相应的设计model.matrix()
,例如:
lm(mpg ~ factor(gear) + I(cyl > 4), data = mtcars)
如果你想自己创建假人,那么看看model.matrix()
model.matrix(~ - 1 + factor(gear), data = mtcars)
factor(gear)3 factor(gear)4 factor(gear)5
Mazda RX4 0 1 0
Mazda RX4 Wag 0 1 0
Datsun 710 0 1 0
Hornet 4 Drive 1 0 0
Hornet Sportabout 1 0 0
Valiant 1 0 0
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.