[英]How to make predictions using an LDA (Linear discriminant analysis) model in R
正如標題所示,我正在嘗試使用 R 中的 LDA model 進行預測。 我有兩組正在使用的數據:第一組是與 16 個預測變量和 1 個結果變量相關聯的一系列條目(結果變量是每個條目屬於我自己分配的“組”) ,第二組數據也包含與相同的 16 個預測變量相關聯的條目,但沒有結果變量。 我想做的是預測第二組數據中條目的組成員身份。
到目前為止,我已經成功地通過將第一個數據集分為“訓練集”和“測試集”來創建 LDA model。 但是,現在我有了 model,我不知道如何預測我的第二個數據集中條目的組成員身份。
感謝您的幫助,如果需要更多信息,請告訴我。 這是我關於堆棧溢出的第一篇文章,所以我還在學習。
基於統計學習簡介的簡短示例,第 4 章。 假設您在training_data
集上安裝了 model lda_model
,其中包含您要預測的因變量Group
,以及預測變量Predictor1
和Predictor2
library(MASS)
lda_model <- lda (Group∼ Predictor1 + Predictor2, data = training_set)
然后,您可以使用 testing_set 上的predict
testing_set
對lda_model
進行預測
lda_predictions <- predict (lda_model, testing_set)
然后, lda_predictions
在$posterior
中保存觀測值是Group
j 的一部分的后驗概率。
然后,您可以應用例如(但不限於)50% 概率的閾值。 例如
sum(lda_model$posterior[, 7] >= .5)
返回觀測值屬於Group
7 組的概率大於 50% 的觀測值數量
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.