繁体   English   中英

如何在 R 中使用 LDA(线性判别分析)model 进行预测

[英]How to make predictions using an LDA (Linear discriminant analysis) model in R

正如标题所示,我正在尝试使用 R 中的 LDA model 进行预测。 我有两组正在使用的数据:第一组是与 16 个预测变量和 1 个结果变量相关联的一系列条目(结果变量是每个条目属于我自己分配的“组”) ,第二组数据也包含与相同的 16 个预测变量相关联的条目,但没有结果变量。 我想做的是预测第二组数据中条目的组成员身份。

到目前为止,我已经成功地通过将第一个数据集分为“训练集”和“测试集”来创建 LDA model。 但是,现在我有了 model,我不知道如何预测我的第二个数据集中条目的组成员身份。

感谢您的帮助,如果需要更多信息,请告诉我。 这是我关于堆栈溢出的第一篇文章,所以我还在学习。

基于统计学习简介的简短示例,第 4 章 假设您在training_data集上安装了 model lda_model ,其中包含您要预测的因变量Group ,以及预测变量Predictor1Predictor2

library(MASS)
lda_model <- lda (Group∼ Predictor1 + Predictor2, data = training_set)

然后,您可以使用 testing_set 上的predict testing_setlda_model进行预测

lda_predictions <- predict (lda_model, testing_set)

然后, lda_predictions$posterior中保存观测值是Group j 的一部分的后验概率。

然后,您可以应用例如(但不限于)50% 概率的阈值。 例如

sum(lda_model$posterior[, 7] >= .5)

返回观测值属于Group 7 组的概率大于 50% 的观测值数量

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM