[英]3D scatterplot done with plot3D producing strange behaviour
我正在尝试使用库plot3D
在 3D scatter plot 中显示最适合的平面。 当下面的代码运行时,一切似乎都很好,但是如果我用第二个fit
替换fit
,我会得到奇怪的行为,飞机不再是平面。 我希望两个版本都能产生相同的画面。 这是怎么回事?
library(plot3D)
df <- structure(list(X = 1:10, TV = c(230.1, 44.5, 17.2, 151.5, 180.8,
8.7, 57.5, 120.2, 8.6, 199.8), radio = c(37.8, 39.3, 45.9, 41.3,
10.8, 48.9, 32.8, 19.6, 2.1, 2.6), newspaper = c(69.2, 45.1,
69.3, 58.5, 58.4, 75, 23.5, 11.6, 1, 21.2), sales = c(22.1, 10.4,
9.3, 18.5, 12.9, 7.2, 11.8, 13.2, 4.8, 10.6)), .Names = c("X",
"TV", "radio", "newspaper", "sales"), row.names = c(NA, 10L), class = "data.frame")
x<-df$TV
y<-df$radio
z<-df$sales
fit <- lm(z ~ x + y)
# fit <- lm(df$sales ~ df$TV + df$radio)
x.pred <- seq(min(x), max(x), length.out = 5)
y.pred <- seq(min(y), max(y), length.out = 5)
xy <- expand.grid( x = x.pred, y = y.pred)
z.pred <- matrix(predict(fit, newdata = xy), nrow = 5, ncol = 5)
scatter3D(x, y, z,
surf = list(x = x.pred, y = y.pred, z = z.pred)
)
简短的回答是:两种拟合都是正确的。 然而,第二个predict
没有找到要预测的正确列名。
如果您希望第二次适合工作,请使用:
fit <- lm(sales ~ TV + radio, data=df)
...
xy <- expand.grid(TV = x.pred, radio = y.pred)
为什么? 因为predict
总是搜索它在newdata
中训练的列名。
您可能注意到上面代码中的第一行也发生了变化,我们不再使用df$var
格式,而是使用data
参数。 发生这种情况是因为当使用这种格式时fit$model
等于:
df$sales df$TV df$radio
1 22.1 230.1 37.8
2 10.4 44.5 39.3
3 9.3 17.2 45.9
...
而且我们不能用“$”美元符号命名列名。 换句话说,我们不能这样做:
fit <- lm(df$sales ~ df$TV + df$radio)
...
xy <- expand.grid(df$TV = x.pred, df$radio = y.pred)
因为它会抛出一个错误。
如上所述,这两种拟合确实是正确的。 如果你跑,
fit <- lm(z ~ x + y)
fit
你会得到,
系数:(截距)xy
2.08052 0.05598 0.15282
与,
fit <- lm(df$sales ~ df$TV + df$radio)
fit
你会得到,
系数:(截距)xy
2.08052 0.05598 0.15282
也是。
最后,请注意,当使用newdata
进行predict
时找不到正确的变量名称时,您将收到如下警告消息:
'newdata' had 25 rows but variables found have 10 rows
我认为这应该是一个错误。 但它可能会在下一个版本中得到修复。 关于这个问题的其他一些来源是:
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.