[英]KNN ValueError: Input contains NaN, infinity or a value too large for dtype('float64')
[英]StandardScaler -ValueError: Input contains NaN, infinity or a value too large for dtype('float64')
我有以下代碼
X = df_X.as_matrix(header[1:col_num])
scaler = preprocessing.StandardScaler().fit(X)
X_nor = scaler.transform(X)
並得到以下錯誤:
File "/Users/edamame/Library/python_virenv/lib/python2.7/site-packages/sklearn/utils/validation.py", line 54, in _assert_all_finite
" or a value too large for %r." % X.dtype)
ValueError: Input contains NaN, infinity or a value too large for dtype('float64').
我用了:
print(np.isinf(X))
print(np.isnan(X))
這給了我下面的輸出。 因為我有數百萬行,所以這不能真正告訴我哪個元素有問題。
[[False False False ..., False False False]
[False False False ..., False False False]
[False False False ..., False False False]
...,
[False False False ..., False False False]
[False False False ..., False False False]
[False False False ..., False False False]]
有沒有辦法確定矩陣X中的哪個值實際上導致了問題? 人們一般如何避免使用它?
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.