如何将带有 keras 回归器的 scikit-learn 管道保存到磁盘？

Question

我有一个带有 kerasRegressor 的 scikit-learn 管道：

estimators = [
    ('standardize', StandardScaler()),
    ('mlp', KerasRegressor(build_fn=baseline_model, nb_epoch=5, batch_size=1000, verbose=1))
    ]
pipeline = Pipeline(estimators)

之后，训练管道，我尝试使用 joblib 保存到磁盘...

joblib.dump(pipeline, filename , compress=9)

但我收到一个错误：

运行时错误：超出最大递归深度

您将如何将管道保存到磁盘？

Answer 1

我遇到了同样的问题，因为没有直接的方法可以做到这一点。 这是一个对我有用的黑客。 我将管道保存到两个文件中。 第一个文件存储了 sklearn 管道的腌制对象，第二个文件用于存储 Keras 模型：

...
from keras.models import load_model
from sklearn.externals import joblib

...

pipeline = Pipeline([
    ('scaler', StandardScaler()),
    ('estimator', KerasRegressor(build_model))
])

pipeline.fit(X_train, y_train)

# Save the Keras model first:
pipeline.named_steps['estimator'].model.save('keras_model.h5')

# This hack allows us to save the sklearn pipeline:
pipeline.named_steps['estimator'].model = None

# Finally, save the pipeline:
joblib.dump(pipeline, 'sklearn_pipeline.pkl')

del pipeline

这是模型可以加载回的方式：

# Load the pipeline first:
pipeline = joblib.load('sklearn_pipeline.pkl')

# Then, load the Keras model:
pipeline.named_steps['estimator'].model = load_model('keras_model.h5')

y_pred = pipeline.predict(X_test)

Answer 2

Keras 与开箱即用的 pickle 不兼容。 如果你愿意修补它，你可以修复它： https : //github.com/tensorflow/tensorflow/pull/39609#issuecomment-683370566 。

您还可以使用 SciKeras 库，它为您执行此操作并且是KerasClassifier替代KerasClassifier ： https : //github.com/adriangb/scikeras

披露：我是 SciKeras 以及那个 PR 的作者。

如何将带有 keras 回归器的 scikit-learn 管道保存到磁盘？

问题描述

2 个解决方案

解决方案1
29 已采纳 2017-04-14 16:25:11

解决方案2
1 2020-09-02 22:05:49

如何将带有 keras 回归器的 scikit-learn 管道保存到磁盘？

问题描述

2 个解决方案

解决方案1 29 已采纳 2017-04-14 16:25:11

解决方案2 1 2020-09-02 22:05:49

解决方案1
29 已采纳 2017-04-14 16:25:11

解决方案2
1 2020-09-02 22:05:49