[英]Python - Sklearn mean using another column as variable
我正在嘗試使用 SimpleImputer 中的 mean 選項替換所有 'nan' 值:
imputer = SimpleImputer(missing_values=np.nan, strategy='mean', verbose=0)
imputer = imputer.fit(X[:, 1:3])
X[:, 1:3] = imputer.transform(X[:, 1:3])
(基本上是我的第一列和第二列的平均值)但是,我需要平均值來考慮第 0 列(行業)。 X 是:
Col 0 = Industry
Col 1 = # of Employees
Col 2 = # Budget
有沒有辦法使用 SimpleImputer 選項來實現這一點?
謝謝
編輯:X 的附加數據:
import pandas as pd
dataset = pd.read_csv('Group A.csv')
X = dataset.iloc[:, :-1].values
我認為在industry
專欄上擬合輸入法應該是訣竅:
imputer = imputer.fit(X[:, 0])
雖然像以前一樣做變換。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.