簡體 English 中英

在不平衡數據集中最大化多數類別的預測准確性

[英]Maximising prediction accuracy of the majority class in an imbalanced dataset

原文 2018-06-25 13:53:37 4 1 python/ optimization/ classification/ data-science

當談論不平衡的數據集時，大多數文章會提到最大化少數群體類別的預測（例如，用於欺詐檢測）。 我有一個不平衡的數據集（比率約為1:20）。 我有興趣在大多數班級達到最高的預測精度的地方。 我的工作是在Python中進行的。 我研究過的可能解決方案是：

少數群體的過度采樣
更改某些分類模型的損失/成本矩陣

使用每種方法的優缺點是什么？ 我還有其他方法可以嘗試嗎？

1 個解決方案

您在想這是錯誤的方式。 如果您關心的只是多數階級，那么您就可以預測一切都屬於多數階級。 您會正確地獲得其中的100％。 您可能會有很多誤報，但您不在乎這些嗎？

嗯，如果您確實關心誤報，那實際上意味着您實際上關心的是少數群體。 您正確預測的少數群體中的事情越多，您的假陽性就越少。

這是同一枚硬幣的兩個面。

將class_weight用於keras中的不平衡數據集時准確性顯着降低

[英]Significantly lower accuracy while using class_weight for imbalanced dataset in keras

為卷積神經網絡中的不平衡數據集添加類權重

[英]Adding Class Weights for imbalanced dataset in Convolutional Neural Network

訓練准確度和類預測計算准確度的區別

[英]Difference between training accuracy and calculating accuracy with class prediction

神經網絡將所有事物歸為一類，不平衡數據集的召回率= 1

[英]Neural network classifies everything into one class, recall=1 on imbalanced dataset

使用 Keras 的不平衡數據集

[英]Imbalanced Dataset Using Keras

具有不平衡數據集的多標簽分類

[英]Multilabel classification with imbalanced dataset

具有不平衡二進制數據集的ML

[英]ML with imbalanced binary dataset

.csv 中的不平衡數據集

[英]Imbalanced dataset in .csv

不平衡分類數據的准確度指標

[英]Accuracy metric on imbalanced classification data

驗證准確性不能改善不平衡數據

[英]Validation accuracy not improving imbalanced data

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 將class_weight用於keras中的不平衡數據集時准確性顯着降低為卷積神經網絡中的不平衡數據集添加類權重訓練准確度和類預測計算准確度的區別神經網絡將所有事物歸為一類，不平衡數據集的召回率= 1 使用 Keras 的不平衡數據集具有不平衡數據集的多標簽分類具有不平衡二進制數據集的ML .csv 中的不平衡數據集不平衡分類數據的准確度指標驗證准確性不能改善不平衡數據

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM