繁体 English 中英

TensorFlow：是否可以为多GPU训练恢复检查点模型？

[英]TensorFlow: Is it possible to restore checkpoint models for multi-gpu training?

原文 2017-02-22 09:30:00 4 1 python/ machine-learning/ tensorflow/ deep-learning

我目前正在使用主管，并且仅使用TF-slim的预训练权重构建了一张图来进行转移学习。 我想知道是否有一种方法可以在一开始就将检查点模型还原到多个推理模型？ 我主要关心的是，首先，在TF存储库上的参考代码中定义的名称范围可能会由于名称不匹配而导致无法恢复预训练变量。 此外，鉴于我必须使用带有init_fn的管理程序，该管理器仅使用一个可恢复变量的保护程序，我如何才能有多个保护程序将相同的变量恢复到多个GPU（如果我甚至根本需要多个保护程序）。

我的一个想法是，也许我可以将变量还原到一个图形，然后让其他GPU使用相同的图形进行训练。 但是，是否仅在第一个GPU完成后才进行下一个GPU的培训？ 但是通过这种方式，除非我编辑检查点权重的名称，否则我也将无法根据原始检查点模型变量名称来恢复权重。

1 个解决方案

关于保存和恢复变量的tensorflow文档将您指向saver对象，允许您在构造saver时通过将字典从保存的名称传递到变量对象来指定将哪些保存的变量恢复为模型变量。

TensorFlow MirroredStrategy() 不适用于多 GPU 训练

[英]TensorFlow MirroredStrategy() not working for multi-gpu training

Tensorflow Multi-GPU丢失

[英]Tensorflow Multi-GPU loss

Tensorflow 多 GPU - NCCL

[英]Tensorflow Multi-GPU - NCCL

AllenNLP共参考分辨率的多GPU训练

[英]Multi-GPU training of AllenNLP coreference resolution

tensorflow 多 GPU 训练

[英]tensorflow multi GPU training

Tensorflow GPU /多GPU如何分配内存？

[英]How Tensorflow GPU/multi-GPU allocates memory?

Choiche GPU tensorflow-directml 或多 GPU

[英]Choiche GPU tensorflow-directml or multi-gpu

在特定迭代或检查点将模型加载/恢复到张量流

[英]Load / restore models into tensorflow at specific iteration or checkpoint

Tensorflow多GPU重用与复制？

[英]Tensorflow Multi-GPU reusing vs. duplicating?

如何为 tensorflow 多 GPU 代码实现批量归一化层

[英]How to implement batch normalization layer for tensorflow multi-GPU code

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 TensorFlow MirroredStrategy() 不适用于多 GPU 训练 Tensorflow Multi-GPU丢失 Tensorflow 多 GPU - NCCL AllenNLP共参考分辨率的多GPU训练 tensorflow 多 GPU 训练 Tensorflow GPU /多GPU如何分配内存？ Choiche GPU tensorflow-directml 或多 GPU 在特定迭代或检查点将模型加载/恢复到张量流 Tensorflow多GPU重用与复制？如何为 tensorflow 多 GPU 代码实现批量归一化层

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM