簡體   English   中英

Spark二進制分類預測精度

[英]Spark binary classifications predictions accuracy

我正在使用Spark mlib進行二進制分類。 我用3000張照片訓練了一個模型,可以預測它是男性還是女性1/0。

final NaiveBayesModel model = NaiveBayes.train(training.rdd(), 1.0);
JavaRDD predictions = test.map(new Function<Vector, Double>() {
            @Override
            public Double call(Vector p) {
                return model.predict(p);
            }
        });

我有一個問題,如果一張照片沒有人。 例如花的圖片。 無論如何,我都會得到結果。 有沒有辦法查看當前決策的准確性? 例如,如果我們嘗試對花朵圖片進行預測,則此Vector為30%男性。 還是我需要使用多分類,例如男性/女性/其他?

正如您在問題中指出的那樣,如果您當前正在訓練模型進行二進制分類,那么這就是所有要做的事情。 您可以至少做兩件事:

  1. 根據您的建議,訓練您的模型來預測三個類別( malefemaleother )。
  2. 使用兩個二元模型,一個用於在human present / not present之間進行預測,然后僅將human present結果傳遞給單獨的male / female分類器。

很難預先知道哪種方法會更有效,但是由於您使用的是mllib ,因此直接嘗試一下這兩種方法,看看哪種方法更好是應該的。 確保使用良好的train/validation/test進行比較。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM