繁体 English 中英

在GPU上训练RNN-我应该使用哪个tf.keras层？

[英]Training RNN on GPU - which tf.keras layer should I use?

原文 2019-08-05 14:27:12 4 1 python/ tensorflow/ keras/ tf.keras

我正在训练使用tf.keras.layers.GRU图层构建的RNN。 他们需要很长时间来训练（> 2个小时），所以我将把它们部署到GPU上进行训练。 我想知道有关GPU训练的一些事情：

tf.keras.layers.CuDNNGRU和tf.keras.layers.GRU （以及tf.keras.layers.LSTM和tf.keras.layers.CuDNNLSTM ）之间有什么区别？ 我从这篇文章中CuDNNGRU ， CuDNNGRU层的训练速度比GRU层快，但是
- 使用相同的种子，这两个层会收敛到不同的结果吗？
- 这两个层在推理过程中是否执行相同的操作？
- CuDNN层在推理期间是否需要GPU？
- GRU层可以在GPU上运行推理吗？
- CuDNN层易于部署吗？ 我目前正在使用coremlconverter将我的keras模型转换为CoreML进行部署。
是否有一个相当于CuDNN层为tf.keras.layers.SimpleRNN （即tf.keras.layers.CuDNNSimpleRNN ）？ 我还没有致力于特定的体系结构，因此，我认为如果我决定使用SimpleRNN，并且CuDNN层具有一些所需的功能，那么我将需要tf.keras.layers.CuDNNSimpleRNN层。
使用CuDNN层时，我需要安装tensorflow-gpu吗？ 还是只要我安装了相关的驱动程序，它们是否仍会部署到GPU？

1 个解决方案

如果您使用的是与cuda兼容的GPU，则使用CuDNN图层绝对有意义。 它们具有不同的实现，试图克服RNN体系结构中固有的计算并行化问题。 尽管它们通常表现较差，但是速度要快3到6倍https://twitter.com/fchollet/status/918170264608817152?lang=en

使用相同的种子，这两个层会收敛到不同的结果吗？

是

这两个层在推理过程中是否执行相同的操作？

您应该具有可比的性能，但不完全相同

CuDNN层在推理期间是否需要GPU？

是的，但是您可以转换为与CuDNN兼容的GRU / LSTM

GRU层可以在GPU上运行推理吗？

是

使用CuDNN层时，我需要安装tensorflow-gpu吗？ 还是只要我安装了相关的驱动程序，它们是否仍会部署到GPU？

是的，您需要兼容cuda的GPU

tf.keras 输入层仅用于推理期间

[英]tf.keras input layer only for use during inference

tf.keras (RNN) 层在运行 model.fit() 时出现问题

[英]tf.keras (RNN) Layer issues when running model.fit()

如何使用 tf.keras 在 RNN 中应用层归一化？

[英]How do you apply layer normalization in an RNN using tf.keras?

TF.Keras SparseCategoricalCrossEntropy 在 GPU 上返回 nan

[英]TF.Keras SparseCategoricalCrossEntropy return nan on GPU

恢复训练 tf.keras Tensorboard

[英]Resume Training tf.keras Tensorboard

tf.keras “所有图层名称都应该是唯一的。” 但是图层名称已经更改

[英]tf.keras "All layer names should be unique." but layer names are already changed

将tf.Keras与Tensorflow优化器一起使用

[英]Use tf.Keras with Tensorflow optimizer

如何为 tf.keras 模型的隐藏层选择输出神经元的值？

[英]How can I choose the value of output neurons for the hidden layer of tf.keras model?

我怎么知道在tf.keras中实现了哪个版本的Keras API？

[英]How do I know which version of the Keras API is implemented in tf.keras?

tf.keras 在训练期间获得计算梯度

[英]tf.keras get computed gradient during training

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 tf.keras 输入层仅用于推理期间 tf.keras (RNN) 层在运行 model.fit() 时出现问题如何使用 tf.keras 在 RNN 中应用层归一化？ TF.Keras SparseCategoricalCrossEntropy 在 GPU 上返回 nan 恢复训练 tf.keras Tensorboard tf.keras “所有图层名称都应该是唯一的。” 但是图层名称已经更改将tf.Keras与Tensorflow优化器一起使用如何为 tf.keras 模型的隐藏层选择输出神经元的值？我怎么知道在tf.keras中实现了哪个版本的Keras API？ tf.keras 在训练期间获得计算梯度

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM