PyTorch LSTM 辍学与 Keras LSTM 辍学

Question

我正在尝试将我的顺序 Keras 网络移植到 PyTorch。 但我在使用 LSTM 单元时遇到了问题：

LSTM(512,
     stateful = False,
     return_sequences = True,
     dropout = 0.5),
LSTM(512,
     stateful = False,
     return_sequences = True,
     dropout = 0.5),

我应该如何在 PyTorch 中制定这个？ 特别是 dropout 在 PyTorch 中的工作方式与在 Keras 中的工作方式截然不同。

Answer 1

以下内容应该适合您。

lstm = nn.LSTM(
    input_size = ?, 
    hidden_size = 512, 
    num_layers = 1,
    batch_first = True, 
    dropout = 0.5
)

您需要设置input_size 。 查看有关LSTM的文档。

更新

在 1 层 LSTM 中，分配 dropout 没有意义，因为 dropout 应用于多层 LSTM 模块中的中间层的输出。 因此，如果num_layers设置为 1，PyTorch 可能会抱怨 dropout。如果我们想在 LSTM 模块的最后一层的 output 上应用 dropout，我们可以执行以下操作。

lstm = nn.Sequential(
    nn.LSTM(
        input_size = ?, 
        hidden_size = 512, 
        num_layers = 1,
        batch_first = True
    ),
    nn.Dropout(0.5)
)

根据上面的定义，LSTM的output会经过一个Dropout层。

PyTorch LSTM 辍学与 Keras LSTM 辍学

问题描述

1 个解决方案

解决方案1
1 2020-06-09 09:58:06

PyTorch LSTM 辍学与 Keras LSTM 辍学

问题描述

1 个解决方案

解决方案1 1 2020-06-09 09:58:06

解决方案1
1 2020-06-09 09:58:06