将 fit_transform 与 OneHotEncoder 一起使用时出现 Memory 错误

Question

我正在尝试对我的数据集中的分类列进行热编码。 我正在使用以下 function：

def create_ohe(df, col):
    le = LabelEncoder()
    a = le.fit_transform(df_new[col]).reshape(-1,1)
    ohe = OneHotEncoder(sparse=False)
    column_names = [col + "_" + str(i) for i in le.classes_]
    return (pd.DataFrame(ohe.fit_transform(a), columns=column_names))

在此循环中调用 function 时出现 MemoryError：

for column in categorical_columns:
    temp_df = create_ohe(df_new, column)
    temp = pd.concat([temp, temp_df], axis=1)

错误回溯：

MemoryError                               Traceback (most recent call last)
<ipython-input-40-9b241e8bf9e6> in <module>
      1 for column in categorical_columns:
----> 2     temp_df = create_ohe(df_new, column)
      3     temp = pd.concat([temp, temp_df], axis=1)
      4 print("\nShape of final df after one hot encoding: ", temp.shape)

<ipython-input-34-1530423fdf06> in create_ohe(df, col)
      8     ohe = OneHotEncoder(sparse=False)
      9     column_names = [col + "_" + str(i) for i in le.classes_]
---> 10     return (pd.DataFrame(ohe.fit_transform(a), columns=column_names))

MemoryError:

Answer 1

Ah memory error means that either your computer is at the maximum use of your memory (RAM) or that python is at the maximum: Memory errors and list limits?

您可以尝试拆分a = le.fit_transform(df_new[col]).reshape(-1,1)方法。 尝试运行b= le.fit(df_new[col])以便将 label 编码器与完整数据集相匹配，然后您可以拆分它，不要同时为每一行转换它，也许这有帮助. 如果b= le.fit(df_new[col])也不起作用，则您有 memory 问题，您可以将col替换为列名。

fit_transform是fit和transform的组合。

将 fit_transform 与 OneHotEncoder 一起使用时出现 Memory 错误

问题描述

1 个解决方案

解决方案1
0 已采纳 2019-11-04 07:01:48

将 fit_transform 与 OneHotEncoder 一起使用时出现 Memory 错误

问题描述

1 个解决方案

解决方案1 0 已采纳 2019-11-04 07:01:48

解决方案1
0 已采纳 2019-11-04 07:01:48