如何使用 tf.keras 在 RNN 中应用层归一化？

Question

我想使用 tf.keras 将层归一化应用于循环神经网络。 在TensorFlow 2.0，有一个LayerNormalization类tf.layers.experimental ，但目前还不清楚如何像复发性层中使用它LSTM ，在每个时间步骤（因为它被设计成可以使用）。 我应该创建一个自定义单元格，还是有更简单的方法？

例如，在每个时间步应用 dropout 就像在创建LSTM层时设置recurrent_dropout参数一样简单，但没有recurrent_layer_normalization参数。

Answer 1

您可以通过继承SimpleRNNCell类来创建自定义单元格，如下所示：

import numpy as np
from tensorflow.keras.models import Sequential
from tensorflow.keras.activations import get as get_activation
from tensorflow.keras.layers import SimpleRNNCell, RNN, Layer
from tensorflow.keras.layers.experimental import LayerNormalization

class SimpleRNNCellWithLayerNorm(SimpleRNNCell):
    def __init__(self, units, **kwargs):
        self.activation = get_activation(kwargs.get("activation", "tanh"))
        kwargs["activation"] = None
        super().__init__(units, **kwargs)
        self.layer_norm = LayerNormalization()
    def call(self, inputs, states):
        outputs, new_states = super().call(inputs, states)
        norm_out = self.activation(self.layer_norm(outputs))
        return norm_out, [norm_out]

此实现在没有任何activation情况下运行常规SimpleRNN单元一步，然后将层范数应用于结果输出，然后应用activation 。 然后你可以这样使用它：

model = Sequential([
    RNN(SimpleRNNCellWithLayerNorm(20), return_sequences=True,
        input_shape=[None, 20]),
    RNN(SimpleRNNCellWithLayerNorm(5)),
])

model.compile(loss="mse", optimizer="sgd")
X_train = np.random.randn(100, 50, 20)
Y_train = np.random.randn(100, 5)
history = model.fit(X_train, Y_train, epochs=2)

对于 GRU 和 LSTM 单元，人们通常在门上应用层范数（在输入和状态的线性组合之后，在 sigmoid 激活之前），因此实现起来有点棘手。 或者，您可以通过在应用activation和recurrent_activation之前应用层范数来获得良好的结果，这会更容易实现。

Answer 2

在 tensorflow 插件中，有一个LayerNormLSTMCell用的预构建LayerNormLSTMCell 。

有关更多详细信息，请参阅此文档。 您可能必须先安装tensorflow-addons然后才能导入此单元格。

pip install tensorflow-addons

如何使用 tf.keras 在 RNN 中应用层归一化？

问题描述

2 个解决方案

解决方案1
4 2019-04-09 04:05:47

解决方案2
4 2020-06-24 03:16:04

如何使用 tf.keras 在 RNN 中应用层归一化？

问题描述

2 个解决方案

解决方案1 4 2019-04-09 04:05:47

解决方案2 4 2020-06-24 03:16:04

解决方案1
4 2019-04-09 04:05:47

解决方案2
4 2020-06-24 03:16:04