繁体   English   中英

保存插入符号预测 model 并应用于 R 中的外部数据

[英]Save out a caret prediction model and apply to external data in R

我已经运行了插入符号预测 model

fit <- train(outcome~ ., data = training, 
                    method = 'glmnet', 
                    metric = "ROC",
                    tuneLength = 5,
                    trControl = fitControl)

fit

现在我想将 model 应用到样本外(外部)验证集 - 但是我无法访问这些数据,我将最终模型发送给合作者,让他们应用到他们的数据

我最初通过以下方式保存了最终的 model:

combined_coef<-as.matrix(exp(coef(fit$finalModel, fit$bestTune$lambda)))

所以它可以被读入并将其应用于新数据

fitValidation <- predict(fit, newdata = validation, type = "prob")

它不适用于数据框或矩阵,当作为列表读入时,错误消息是:

"Error in UseMethod("predict") : 
  no applicable method for 'predict' applied to an object of class "c('tbl_df', 'tbl', 'data.frame')"

那么它必须是整个 model 适合 object 吗? 有没有比保存并发送整个(大量)适合的 object 更简单的方法? 有没有办法只保存“最终模型”(如上),然后在“预测”调用中应用它?

谢谢

正如 Sirius 所说,最好的方法是保存 model object。 它不应该那么大。

但是,在紧要关头,另一个选择是让您的合作者手动评分 model。 可以通过将验证矩阵与系数向量相乘来做到这一点。 代码如下所示,假设您有一个与 model 矩阵和coefficients作为向量格式相同的矩阵validation 此计算用于逻辑回归,并且假设您使用 ROC 作为拟合指标,这应该是您所需要的。

# do the scoring via matrix multiplication
scores <- t(t(validation) * coefficients)

# sum the scores by row and exponentiate. 
log_odds <- exp(rowSums(scores, na.rm = TRUE))
final_scores <- log_odds / (1 + log_odds)

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM