繁体   English   中英

在 Keras 中使用 Adam 优化器恢复训练

[英]Resume training with Adam optimizer in Keras

我的问题很简单,但我在网上找不到明确的答案(到目前为止)。

在定义的训练周期数之后,我使用以下方法保存了使用 adam 优化器训练的 keras 模型的权重:

callback = tf.keras.callbacks.ModelCheckpoint(filepath=path, save_weights_only=True)
model.fit(X,y,callbacks=[callback])

当我关闭 jupyter 后恢复训练时,我可以简单地使用:

model.load_weights(path)

继续训练。

由于 Adam 依赖于 epoch 数(例如在学习率衰减的情况下),我想知道在与以前相同的条件下恢复训练的最简单方法。

按照 ibarrond 的回答,我编写了一个小的自定义回调。

optim = tf.keras.optimizers.Adam()
model.compile(optimizer=optim, loss='categorical_crossentropy',metrics=['accuracy'])

weight_callback = tf.keras.callbacks.ModelCheckpoint(filepath=checkpoint_path, save_weights_only=True, verbose=1, save_best_only=False)

class optim_callback(tf.keras.callbacks.Callback):
    '''Custom callback to save optimiser state'''

          def on_epoch_end(self,epoch,logs=None):
                optim_state = tf.keras.optimizers.Adam.get_config(optim)
                with open(optim_state_pkl,'wb') as f_out:                  
                       pickle.dump(optim_state,f_out)

model.fit(X,y,callbacks=[weight_callback,optim_callback()])

当我恢复训练时:

model.load_weights(checkpoint_path)
with open(optim_state_pkl,'rb') as f_out:                  
                    optim_state = pickle.load(f_out)
tf.keras.optimizers.Adam.from_config(optim_state)

我只是想检查一下这是否正确。 再次感谢!!

附录:在进一步阅读 Adam 的默认Keras 实现原始 Adam 论文时,我认为默认 Adam 不依赖于纪元数,而仅依赖于迭代数。 因此,这是不必要的。 但是,对于希望跟踪其他优化器的任何人,该代码可能仍然有用。

为了完美地捕获优化器的状态,您应该使用函数get_config()存储其配置。 此函数返回一个字典(包含选项) ,可以使用pickle将其序列化并存储在文件中。

要重新启动该过程,只需d = pickle.load('my_saved_tfconf.txt')来检索具有配置的字典,然后使用from_config(d) Adam 优化器的from_config(d)函数生成您的 Adam 优化器。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM