[英]How to implement a non linear model regression in R
我对R和Statistics都是新手,确实需要您的帮助。 我应该分析一些数据以找到描述它的分析模型。 我有2个响应(y1,y2)和(4个预测变量)。 我想到了使用R进行分析的步骤,并遵循以下步骤:1)对于每个响应,我测试了线性模型( lm
命令),发现:
Call:
lm(formula = data_mass$m ~ ., data = data_mass)
Residuals:
Min 1Q Median 3Q Max
-7.805e-06 -1.849e-06 -1.810e-07 2.453e-06 7.327e-06
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -1.367e-04 1.845e-05 -7.413 1.47e-06 ***
d 1.632e-04 1.134e-05 14.394 1.42e-10 ***
L 2.630e-08 1.276e-07 0.206 0.83927
D 1.584e-05 5.103e-06 3.104 0.00682 **
p 1.101e-06 1.195e-07 9.215 8.46e-08 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 4.472e-06 on 16 degrees of freedom
Multiple R-squared: 0.9543, Adjusted R-squared: 0.9429
F-statistic: 83.51 on 4 and 16 DF, p-value: 1.645e-10
2)因此,我通过查看plot(model)
图来分析模型的优良程度。 查看“残差与拟合值”图,模型应该不是线性的! 这是正确的吗?
3)我试图消除一些因素(例如“ L”)并引入一些二次项(d ^ 2; D ^ 2),但是“残差与拟合值”图具有相同的趋势。
我现在能做什么? 我应该使用非线性模型吗?
谢谢大家可以帮助我=)
更新 :
再次感谢你。 我附上了plot(model)和DATA的图形。 响应为m,Fz和预测变量d,L,D,p。 该模型是响应m的线性模型。
[Residual vs Fitted][1]
[Normal Q-Q][2]
[Scale Location][3]
[Residual vs Leverage][4]
[DATA][5]
enter code here
看“残值对拟合值”图,模型应该不是线性的! 这是正确的吗?
是的,没有。 如果残差的绝对值与拟合值有很强的相关性 ,则可能意味着异方差(方差异质性)。 这样,残差将不会沿着拟合值平均分布。 异方差性是您可以在拟合与残差图上看到的一件事,因为它会使*t*-test
或lm
类的统计检验无效。 您也可以使用比例位置图来确认它(这与该图非常相似,但略胜一筹)。
另一方面,非线性分布表示非线性 ,可能要更改模型的结构。 尽管您既不会在残差与拟合值之间建立线性关系,也不会建立非线性关系:在理想情况下,方案的值应或多或少地随机且对称地散布在两条斜率为0的平行线之间的0附近。 您可以在这里找到有关此问题的更多讨论: 1 2 3
我现在能做什么? 我应该使用非线性模型吗?
如果您的诊断图表明非线性,可能要改变/重组/调整模型(或转换数据) -上有选择的一些讨论, 在这里
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.