簡體 English 中英

在GPU上訓練RNN-我應該使用哪個tf.keras層？

[英]Training RNN on GPU - which tf.keras layer should I use?

原文 2019-08-05 14:27:12 9 1 python/ tensorflow/ keras/ tf.keras

我正在訓練使用tf.keras.layers.GRU圖層構建的RNN。 他們需要很長時間來訓練（> 2個小時），所以我將把它們部署到GPU上進行訓練。 我想知道有關GPU訓練的一些事情：

tf.keras.layers.CuDNNGRU和tf.keras.layers.GRU （以及tf.keras.layers.LSTM和tf.keras.layers.CuDNNLSTM ）之間有什么區別？ 我從這篇文章中CuDNNGRU ， CuDNNGRU層的訓練速度比GRU層快，但是
- 使用相同的種子，這兩個層會收斂到不同的結果嗎？
- 這兩個層在推理過程中是否執行相同的操作？
- CuDNN層在推理期間是否需要GPU？
- GRU層可以在GPU上運行推理嗎？
- CuDNN層易於部署嗎？ 我目前正在使用coremlconverter將我的keras模型轉換為CoreML進行部署。
是否有一個相當於CuDNN層為tf.keras.layers.SimpleRNN （即tf.keras.layers.CuDNNSimpleRNN ）？ 我還沒有致力於特定的體系結構，因此，我認為如果我決定使用SimpleRNN，並且CuDNN層具有一些所需的功能，那么我將需要tf.keras.layers.CuDNNSimpleRNN層。
使用CuDNN層時，我需要安裝tensorflow-gpu嗎？ 還是只要我安裝了相關的驅動程序，它們是否仍會部署到GPU？

1 個解決方案

如果您使用的是與cuda兼容的GPU，則使用CuDNN圖層絕對有意義。 它們具有不同的實現，試圖克服RNN體系結構中固有的計算並行化問題。 盡管它們通常表現較差，但是速度要快3到6倍https://twitter.com/fchollet/status/918170264608817152?lang=en

使用相同的種子，這兩個層會收斂到不同的結果嗎？

是

這兩個層在推理過程中是否執行相同的操作？

您應該具有可比的性能，但不完全相同

CuDNN層在推理期間是否需要GPU？

是的，但是您可以轉換為與CuDNN兼容的GRU / LSTM

GRU層可以在GPU上運行推理嗎？

是

使用CuDNN層時，我需要安裝tensorflow-gpu嗎？ 還是只要我安裝了相關的驅動程序，它們是否仍會部署到GPU？

是的，您需要兼容cuda的GPU

tf.keras 輸入層僅用於推理期間

[英]tf.keras input layer only for use during inference

tf.keras (RNN) 層在運行 model.fit() 時出現問題

[英]tf.keras (RNN) Layer issues when running model.fit()

如何使用 tf.keras 在 RNN 中應用層歸一化？

[英]How do you apply layer normalization in an RNN using tf.keras?

TF.Keras SparseCategoricalCrossEntropy 在 GPU 上返回 nan

[英]TF.Keras SparseCategoricalCrossEntropy return nan on GPU

恢復訓練 tf.keras Tensorboard

[英]Resume Training tf.keras Tensorboard

tf.keras “所有圖層名稱都應該是唯一的。” 但是圖層名稱已經更改

[英]tf.keras "All layer names should be unique." but layer names are already changed

將tf.Keras與Tensorflow優化器一起使用

[英]Use tf.Keras with Tensorflow optimizer

如何為 tf.keras 模型的隱藏層選擇輸出神經元的值？

[英]How can I choose the value of output neurons for the hidden layer of tf.keras model?

我怎么知道在tf.keras中實現了哪個版本的Keras API？

[英]How do I know which version of the Keras API is implemented in tf.keras?

tf.keras 在訓練期間獲得計算梯度

[英]tf.keras get computed gradient during training

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 tf.keras 輸入層僅用於推理期間 tf.keras (RNN) 層在運行 model.fit() 時出現問題如何使用 tf.keras 在 RNN 中應用層歸一化？ TF.Keras SparseCategoricalCrossEntropy 在 GPU 上返回 nan 恢復訓練 tf.keras Tensorboard tf.keras “所有圖層名稱都應該是唯一的。” 但是圖層名稱已經更改將tf.Keras與Tensorflow優化器一起使用如何為 tf.keras 模型的隱藏層選擇輸出神經元的值？我怎么知道在tf.keras中實現了哪個版本的Keras API？ tf.keras 在訓練期間獲得計算梯度

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM