如何使SK Learn分类器接受2D数组作为预测的输入？

Question

因此，我制作了一个具有混合数据类型的模型，并使用了列转换器来构建分类器，并使用了来自SK Learn Docs的推荐示例。

https://scikit-learn.org/stable/auto_examples/compose/plot_column_transformer_mixed_types.html#sphx-glr-auto-examples-compose-plot-column-transformer-mixed-types-py

由于输入来自csv，并转换为Pandas数据框，因此X_test，X_train，y_test和y_train看起来也都是数据框。 将y_test传递到clf.predict（）函数可以正常工作，并且我收到了预测。

但是，我想托管此模型Google Cloud ML Engine，该模型在预测请求API中接受2D实例数组。 如何使分类器适应并接受输入数组而不是数据框？ 我意识到这可能是微不足道的，但是努力寻找解决方案。

Answer 1

为了使您的分类器与Google Cloud Machine Learning Engine（CMLE）兼容，您需要从管道中分离出预处理器和LogisticRegression分类器。 您将需要执行预处理逻辑客户端，并且独立分类器将托管在CMLE上。

读取csv文件并定义数量和分类转换器后，您需要按如下所示修改培训代码：

...

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)

preprocessor = ColumnTransformer(
    transformers=[
        ('num', numeric_transformer, numeric_features),
        ('cat', categorical_transformer, categorical_features)])
model = LogisticRegression(solver='lbfgs')

X_train_transformed = preprocessor.fit_transform(X_train)
model.fit(X_train_transformed, y_train)
print("model score: %.3f" % model.score(preprocessor.transform(X_test), y_test))

您可以导出模型（使用pickle或joblib）并将其部署在CMLE上。 在构造向CMLE进行预测的json请求时，您首先需要使用以下代码将数据帧预处理为2D数组： preprocessor.transform(X_test) 。

如何使SK Learn分类器接受2D数组作为预测的输入？

问题描述

1 个解决方案

解决方案1
0 2019-01-21 17:35:45

如何使SK Learn分类器接受2D数组作为预测的输入？

问题描述

1 个解决方案

解决方案1 0 2019-01-21 17:35:45

解决方案1
0 2019-01-21 17:35:45