[英]Linear Regression model with dummy (dependent) variable and categorical (independent) variable in R
[英]Build Regression Model with Categorical Variable
嗨,我是R的新手,我希望有人能给我一些建立回归模型的提示。 我有一些类似于下面的示例数据的示例数据,其中包含分类变量,例如path变量。 我想将这些分类变量转换为二进制变量,如下面显示的“ Transformed Data”,因此我可以使用它们来创建回归模型,以基于每个路径上的Volume预测WaitTime。 在python中,有一个名为getdummies的函数可以很好地完成此任务。 如果有人可以给我有关r中类似函数的技巧,或者一种使用分类变量构建回归模型的方法。 我将不胜感激。 我的最终目标是建立回归模型,然后为每条路径找到最小化WaitTIme的体积值。 对此肯定有任何提示。
样本数据: Path WaitTime Volume AD_IB 195 3 GMC_DT 154 4 CD_ADT 192 2 Ord_IB 326 1
转换后的数据:
AD_IB GMC_DT CD_ADT Ord_IB WaitTime Volume 1 0 0 0 195 3 0 1 0 0 154 4 0 0 1 0 192 2 0 0 0 1 326 1
R
自动为您做到这一点:
set.seed(1)
d <- data.frame(cat = factor(LETTERS[sample(3, 100, TRUE)]), y = rnorm(100))
lm(y ~ cat, d)
# # Call:
# lm(formula = y ~ cat, data = d)
#
# Coefficients:
# (Intercept) catB catC
# -0.2385 0.3518 0.2493
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.