[英]Nonlinear model with many independent variables (fixed effects) in R
我正在尝试使用将近50个变量拟合非线性模型(因为存在固定年限的影响)。 问题是我有太多变量,无法像上面那样写下完整的公式
nl_exp = as.formula(y ~ t1*year.matrix[,1] + t2*year.matrix[,2]
+... +t45*year.matirx[,45] + g*(x^d))
nl_model = gnls(nl_exp, start=list(t=0.5, g=0.01, d=0.1))
其中y
是二进制响应变量, year.matirx
是45列的矩阵(指示45个不同的年份), x
是自变量。 需要估计的参数是t1, t2, ..., t45, g, d
。
对于t1, ..., t45, g, d
我有很好的起始值。 但是我不想为这种非线性回归写一个长公式。
我知道如果模型是线性的,则表达式可以使用
l_model = lm(y ~ factor(year) + ...)
gnls
函数中尝试了factor(year)
,但它不起作用。 此外,我也尝试过
nl_exp2 = as.formula(y ~ t*year.matrix + g*(x^d))
nl_model2 = gnls(nl_exp2, start=list(t=rep(0.2, 45), g=0.01, d=0.1))
它还返回我错误消息。
那么,有没有简单的方法可以写下非线性公式和R
的起始值?
由于您没有提供任何示例数据,因此我编写了自己的示例数据-完全没有意义,并且该模型实际上不起作用,因为它的数据覆盖率很差,但是很容易理解:
y <- 1:100
x <- 1:100
year.matrix <- matrix(runif(4500, 1, 10), ncol = 45)
start.values <- c(rep(0.5, 45), 0.01, 0.1) #you could also use setNames here and do this all in one row but that gets really messy
names(start.values) <- c(paste0("t", 1:45), "g", "d")
start.values <- as.list(start.values)
nl_exp2 <- as.formula(paste0("y ~ ", paste(paste0("t", 1:45, "*year.matrix[,", 1:45, "]"), collapse = " + "), " + g*(x^d)"))
gnls(nl_exp2, start=start.values)
这可能不是最有效的方法,但是由于您可以将字符串传递给as.formula
因此使用paste
命令来构造您要尝试的操作非常容易。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.