繁体 English 中英

在Tensorflow上训练多GPU：更简单的方法？

[英]Training Multi-GPU on Tensorflow: a simpler way?

原文 2016-12-07 23:10:56 6 1 machine-learning/ tensorflow/ gpu

我一直在使用cifar10_multi_gpu_train示例中提出的训练方法进行（本地）多gpu训练，即创建多个塔然后平均梯度。 但是，我想知道以下几点：如果我只接受来自不同GPU的损失，将其求和，然后对新损失应用梯度下降，会发生什么情况。

那行得通吗？ 可能这是一个愚蠢的问题，并且在某处必须有一个限制。 因此，如果您可以对此发表评论，我将非常高兴。

谢谢您，G.

1 个解决方案

总和不起作用。 您将获得更大的损失，从而导致更大的梯度并且可能是错误的梯度。 在对梯度求平均时，您将获得权重所采用的方向的平均值，以最大程度地减少损失，但是每个方向都是针对确切损失值计算的。

您可以尝试的一件事是独立运行塔，然后不时平均权重，收敛速度较慢，但每个节点的处理速度更快。

TensorFlow：是否可以为多GPU训练恢复检查点模型？

[英]TensorFlow: Is it possible to restore checkpoint models for multi-gpu training?

具有多GPU方法的tensorflow分布式训练混合

[英]tensorflow distributed training hybrid with multi-GPU methodology

TensorFlow：多 GPU 配置（性能）

[英]TensorFlow: Multi-GPU configuration (performance)

多gpu模式下的tensorflow c ++ SetDefaultDevice

[英]tensorflow c++ SetDefaultDevice in multi-gpu mode

自定义模型的 Keras 多 GPU 模型失败

[英]Keras multi-gpu model fails for a custom model

Tensorflow 训练错误 model（在 GPU 上）

[英]Tensorflow error upon training model (on GPU)

在Keras中使用multi_gpu_model恢复培训

[英]Resume training with multi_gpu_model in Keras

针对具有不同 GPU 的变形金刚的多 GPU 训练

[英]Multi GPU training for Transformers with different GPUs

多GPU似乎在TensorFlow1.0上不起作用

[英]Multi GPU seems not work on TensorFlow1.0

在前提下分发 Tensorflow 培训的最简单方法？

[英]Simplest way to distribute Tensorflow training on premise?

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 TensorFlow：是否可以为多GPU训练恢复检查点模型？具有多GPU方法的tensorflow分布式训练混合 TensorFlow：多 GPU 配置（性能）多gpu模式下的tensorflow c ++ SetDefaultDevice 自定义模型的 Keras 多 GPU 模型失败 Tensorflow 训练错误 model（在 GPU 上）在Keras中使用multi_gpu_model恢复培训针对具有不同 GPU 的变形金刚的多 GPU 训练多GPU似乎在TensorFlow1.0上不起作用在前提下分发 Tensorflow 培训的最简单方法？

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM