簡體   English   中英

Python - Sklearn 意味着使用另一列作為變量

[英]Python - Sklearn mean using another column as variable

我正在嘗試使用 SimpleImputer 中的 mean 選項替換所有 'nan' 值:

    imputer = SimpleImputer(missing_values=np.nan, strategy='mean', verbose=0)
    imputer = imputer.fit(X[:, 1:3])
    X[:, 1:3] = imputer.transform(X[:, 1:3])

(基本上是我的第一列和第二列的平均值)但是,我需要平均值來考慮第 0 列(行業)。 X 是:

Col 0 = Industry
Col 1 = # of Employees
Col 2 = # Budget

有沒有辦法使用 SimpleImputer 選項來實現這一點?

  • 用行業平均值替換第 1 列的 nan 值
  • 用行業平均值替換第 2 列的 nan 值

謝謝

編輯:X 的附加數據:

import pandas as pd
dataset = pd.read_csv('Group A.csv')
X = dataset.iloc[:, :-1].values

我認為在industry專欄上擬合輸入法應該是訣竅:

imputer = imputer.fit(X[:, 0])

雖然像以前一樣做變換。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM