簡體   English   中英

Python中的數據預處理

[英]Data preprocessing in Python

嘿,我是數據科學的新手,在這里我試圖在其中一列中查找丟失的數據。但是,我遇到了一個錯誤,指出“X 未定義”。 有人可以幫助我嗎?

#missing data
from sklearn.preprocessing import Imputer
imputer = Imputer(missing_values='NaN', strategy ='mean', axis =0)
imputer = imputer.fit(X[:, 1:3])
X[:, 1:3] = imputer.transform(X[:, 1:3])

“X”表示主 DataFrame 的 numpy.ndarray,減去目標變量。

X = df.iloc[:, :-1].values

試試這個。 應該工作。

要查找單個列的缺失數據,必須使用以下代碼。

dataset_name['column_name'].isnull().sum()

注意:如果我們需要找到缺失的數據,那么就不必擔心 X 變量。 當您嘗試用一些均值/中值/眾數值填充缺失數據時,需要 X 和 y 變量。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM