如何在 R 中使用 LDA（線性判別分析）model 進行預測

Question

正如標題所示，我正在嘗試使用 R 中的 LDA model 進行預測。 我有兩組正在使用的數據：第一組是與 16 個預測變量和 1 個結果變量相關聯的一系列條目（結果變量是每個條目屬於我自己分配的“組”），第二組數據也包含與相同的 16 個預測變量相關聯的條目，但沒有結果變量。 我想做的是預測第二組數據中條目的組成員身份。

到目前為止，我已經成功地通過將第一個數據集分為“訓練集”和“測試集”來創建 LDA model。 但是，現在我有了 model，我不知道如何預測我的第二個數據集中條目的組成員身份。

感謝您的幫助，如果需要更多信息，請告訴我。 這是我關於堆棧溢出的第一篇文章，所以我還在學習。

Answer 1

基於統計學習簡介的簡短示例，第 4 章。 假設您在training_data集上安裝了 model lda_model ，其中包含您要預測的因變量Group ，以及預測變量Predictor1和Predictor2

library(MASS)
lda_model <- lda (Group∼ Predictor1 + Predictor2, data = training_set)

然后，您可以使用 testing_set 上的predict testing_set對lda_model進行預測

lda_predictions <- predict (lda_model, testing_set)

然后， lda_predictions在$posterior中保存觀測值是Group j 的一部分的后驗概率。

然后，您可以應用例如（但不限於）50% 概率的閾值。 例如

sum(lda_model$posterior[, 7] >= .5)

返回觀測值屬於Group 7 組的概率大於 50% 的觀測值數量

如何在 R 中使用 LDA（線性判別分析）model 進行預測

問題描述

1 個解決方案

解決方案1
0 2022-09-02 12:08:23

如何在 R 中使用 LDA（線性判別分析）model 進行預測

問題描述

1 個解決方案

解決方案1 0 2022-09-02 12:08:23

解決方案1
0 2022-09-02 12:08:23