繁体   English   中英

sklearn.naive_bayes.GaussianNB中的ValueError

[英]ValueError in sklearn.naive_bayes.GaussianNB

我开始学习机器学习。 所以我从朴素贝叶斯开始
我的python脚本

import numpy as np
x = np.array([[0,0],[1,1],[0,1],[1,0]])
y = np.array([0,0,1,1])
print(x)
from sklearn.naive_bayes import GaussianNB
clf = GaussianNB()
x = x.reshape(1,-1)
y = y.reshape(1,-1)
clf.fit(x,y)
a = clf.predict([[1,1]])
print(a)

我得到的错误是

[[0 0]
[1 1]
[0 1]
[1 0]]
Traceback (most recent call last):
  File "ex.py", line 9, in <module>
    clf.fit(x,y)
  File "/usr/local/lib/python2.7/dist-packages/sklearn/naive_bayes.py", line 182, in fit
    X, y = check_X_y(X, y)
  File "/usr/local/lib/python2.7/dist-packages/sklearn/utils/validation.py", line 526, in check_X_y
    y = column_or_1d(y, warn=True)
  File "/usr/local/lib/python2.7/dist-packages/sklearn/utils/validation.py", line 562, in column_or_1d
    raise ValueError("bad input shape {0}".format(shape))
ValueError: bad input shape (1, 4)

我该怎么办?

正如我在评论中所说,无需重塑。 您之前(即您提供的代码没有)收到此错误,因为您的代码在此之后工作。

考虑到您总是获得0作为预测的部分,这是由于您的数据。 朴素贝叶斯需要更多样本来分离类别,对于一个非线性问题,每个类别两个样本是不够的。

import numpy as np
from sklearn.naive_bayes import GaussianNB

def GNB(x,y):
    clf = GaussianNB()
    clf.fit(x,y)
    a = clf.predict(x)
    print(a)

x = np.array([[0,0],[1,1],[0,1],[1,0]])
y = np.array([0,0,1,1])
GNB(x,y)
# Output : [0,0,0,0]

x = np.array([[0,0],[0,1],[1,1],[1,0],[3,4],[-2,2],[-3,2],[-4,-2]])
y = np.array([0,0,0,0,1,1,1,1])
GNB(x,y)
# [0 0 0 0 1 1 1 1]

看我的两个例子。 在第一种情况(您提供的情况)中,NB无法成功分离数据。 在第二个示例中(仍然是非线性的),由于样本数量足够,NB成功返回了正确的类。

为了清楚起见,我创建了一个函数,但是您可以在示例中添加更多示例,您将看到它可以正常工作。 希望这对您有所帮助。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM