簡體 English 中英

如何使用二元分類器執行積極的未標記學習？

[英]How to perform positive unlabeled learning using a binary classifier?

原文 2021-05-31 09:28:24 8 1 python/ machine-learning/ pyspark/ supervised-learning/ semisupervised-learning

我在 pyspark 中設置了一個裝袋分類器，其中一個二元分類器對正樣本和相同數量的隨機抽樣未標記樣本進行訓練（給定分數為 1 表示正，0 表示未標記）。 model 然后預測袋外樣本，這個過程重復，所以現在我計划對每個樣本進行平均預測。

我的問題出現在 output model 預測中例如，用於二進制分類的 output 如下所示：

model.transform(test_data).show()
+-----+--------------------+
|label|         probability|
+-----+--------------------+
|    0|[0.294, 0.8]        |
|    1|[0.65, 0.2 ]        |

要從輸出此結果的二元分類器執行未標記的正學習，我是否需要放棄為負 class 預測的概率，並且僅使用 model 對未標記樣本是否為正所做的預測？

1 個解決方案

是的。 您為每個未標記數據獲得的概率是該點為正的概率，因為 model 獲得了收益。 然后你在迭代中取平均值

如何從積極的未標記學習中計算 roc auc 分數？

[英]How to calculate roc auc score from positive unlabeled learning?

在Keras中，如何使用predict_generator對未標記的測試數據執行預測？

[英]How to perform prediction using predict_generator on unlabeled test data in Keras?

如何在H2O隨機森林或其他二進制分類器中指定肯定類？

[英]How do I specify the positive class in an H2O random forest or other binary classifier?

二元分類器只進行真陰性和假陽性預測

[英]Binary classifier making only making true negative and false positive predictions

如何將機器學習分類器連接到Web App？

[英]How to connect a Machine Learning classifier to a Web App?

如何為隨機森林分類器，Ada Boost分類器，Extra Trees分類器訪問python scikit學習代碼

[英]how to access the python scikit learning code for Random Forest Classifier, Ada Boost Classifier, Extra Trees Classifier

二進制分類器如何呈現輸入對？

[英]How present pairs of inputs for binary classifier?

如何翻譯/實現從 matlab 到 python 的多目標二進制分類器優化（多類）（使用 pymoo）？

[英]How to translate/implement a multiobjective binary classifier optimization (multiclass) from matlab to python (using pymoo)?

Keras MLP分類器不學習

[英]Keras MLP classifier not learning

使用二分搜索首次出現正整數

[英]First occurrence of a positive integer using binary search

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 如何從積極的未標記學習中計算 roc auc 分數？在Keras中，如何使用predict_generator對未標記的測試數據執行預測？如何在H2O隨機森林或其他二進制分類器中指定肯定類？二元分類器只進行真陰性和假陽性預測如何將機器學習分類器連接到Web App？如何為隨機森林分類器，Ada Boost分類器，Extra Trees分類器訪問python scikit學習代碼二進制分類器如何呈現輸入對？如何翻譯/實現從 matlab 到 python 的多目標二進制分類器優化（多類）（使用 pymoo）？ Keras MLP分類器不學習使用二分搜索首次出現正整數

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM