簡體   English   中英

朴素貝葉斯分類器的scikit-learn文檔中的示例代碼是否出錯?

[英]Error in example code from the scikit-learn documentation for the Naive Bayes classifier?

我是Python的新用戶,並且一直使用scikit-learn模塊運行Naive Bayes分類器模型。 scikit LearnNaïveBayes文檔頁面上的以下示例代碼正確嗎?

from sklearn import datasets
iris = datasets.load_iris()
from sklearn.naive_bayes import GaussianNB
gnb = GaussianNB()
y_pred = gnb.fit(iris.data, iris.target).predict(iris.data)
print("Number of mislabeled points out of a total %d points : %d"

gnb.fit()函數不應該閱讀:

y_pred = gnb.fit(iris.data.drop(columns=['target']), iris.target).predict(iris.data)

也就是說,需要從預測變量數據集中手動刪除響應變量。 當一位同事指出我從scikit-learn文檔頁面上抄寫的代碼錯誤時,我的模型獲得了不合理的高精度度量。

iris.data不是數據幀,它只是具有4個功能的(150,4)numpy數組。

iris.target是另一個只有目標類的numpy數組。

不知道如何調用數組上的drop (我只是檢查了我有一個數組而不是pd df,這很有意義,sklearn不依賴於熊貓)。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM