繁体   English   中英

建立具有类别变量的回归模型

[英]Build Regression Model with Categorical Variable

嗨,我是R的新手,我希望有人能给我一些建立回归模型的提示。 我有一些类似于下面的示例数据的示例数据,其中包含分类变量,例如path变量。 我想将这些分类变量转换为二进制变量,如下面显示的“ Transformed Data”,因此我可以使用它们来创建回归模型,以基于每个路径上的Volume预测WaitTime。 在python中,有一个名为getdummies的函数可以很好地完成此任务。 如果有人可以给我有关r中类似函数的技巧,或者一种使用分类变量构建回归模型的方法。 我将不胜感激。 我的最终目标是建立回归模型,然后为每条路径找到最小化WaitTIme的体积值。 对此肯定有任何提示。
样本数据: Path WaitTime Volume AD_IB 195 3 GMC_DT 154 4 CD_ADT 192 2 Ord_IB 326 1

转换后的数据:
AD_IB GMC_DT CD_ADT Ord_IB WaitTime Volume 1 0 0 0 195 3 0 1 0 0 154 4 0 0 1 0 192 2 0 0 0 1 326 1

R自动为您做到这一点:

set.seed(1)
d <- data.frame(cat = factor(LETTERS[sample(3, 100, TRUE)]), y = rnorm(100))
lm(y ~ cat, d)

#     # Call:
# lm(formula = y ~ cat, data = d)
# 
# Coefficients:
# (Intercept)         catB         catC  
#     -0.2385       0.3518       0.2493  

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM