簡體   English   中英

如何在 R 中使用 LDA(線性判別分析)model 進行預測

[英]How to make predictions using an LDA (Linear discriminant analysis) model in R

正如標題所示,我正在嘗試使用 R 中的 LDA model 進行預測。 我有兩組正在使用的數據:第一組是與 16 個預測變量和 1 個結果變量相關聯的一系列條目(結果變量是每個條目屬於我自己分配的“組”) ,第二組數據也包含與相同的 16 個預測變量相關聯的條目,但沒有結果變量。 我想做的是預測第二組數據中條目的組成員身份。

到目前為止,我已經成功地通過將第一個數據集分為“訓練集”和“測試集”來創建 LDA model。 但是,現在我有了 model,我不知道如何預測我的第二個數據集中條目的組成員身份。

感謝您的幫助,如果需要更多信息,請告訴我。 這是我關於堆棧溢出的第一篇文章,所以我還在學習。

基於統計學習簡介的簡短示例,第 4 章 假設您在training_data集上安裝了 model lda_model ,其中包含您要預測的因變量Group ,以及預測變量Predictor1Predictor2

library(MASS)
lda_model <- lda (Group∼ Predictor1 + Predictor2, data = training_set)

然后,您可以使用 testing_set 上的predict testing_setlda_model進行預測

lda_predictions <- predict (lda_model, testing_set)

然后, lda_predictions$posterior中保存觀測值是Group j 的一部分的后驗概率。

然后,您可以應用例如(但不限於)50% 概率的閾值。 例如

sum(lda_model$posterior[, 7] >= .5)

返回觀測值屬於Group 7 組的概率大於 50% 的觀測值數量

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM