tf.data.Dataset 的规范化层

Question

我正在尝试改进有关时间序列预测的 Tensorflow 教程。 代码很长，但我的怀疑只是其中的一小部分。 在本教程中，数据归一化是通常的方式：使用训练集的均值和标准差对其进行贬低和标准化。

train_mean = train_df.mean()
train_std = train_df.std()

train_df = (train_df - train_mean) / train_std
val_df = (val_df - train_mean) / train_std
test_df = (test_df - train_mean) / train_std

然后生成一个tf.data.Dataset以将数据提供给算法：

def make_dataset(self, data):

  data = np.array(data, dtype=np.float32)
  ds = tf.keras.utils.timeseries_dataset_from_array(data=data, targets=None, sequence_length=self.total_window_size, sequence_stride=1, shuffle=True)
  ds = ds.map(self.split_window)

  return ds

这个function是一个class的方法，篇幅太长，这里就不报道了。 重要的是它返回输入和标签的元组：

for example_inputs, example_labels in my_class_instance.train.take(1):
  print(f'Inputs shape (batch, time, features): {example_inputs.shape}')
  print(f'Labels shape (batch, time, features): {example_labels.shape}')

回报：

Inputs shape (batch, time, features): (32, 6, 19) 
Labels shape (batch, time, features): (32, 1, 1)

这种方法的问题在于，损失 function 和指标都指的是标准化变量（包括目标变量），而不是我们试图预测的实际值。 为了解决这个问题，我想保留未标准化的特征（以及目标变量），而是在机器学习模型中引入特征归一化层。 我想过使用这样的东西：

normalizer = tf.keras.layers.Normalization(axis=-1)
normalizer.adapt(np.array(train_features))
model.add(normalizer)

我的问题是：如何添加这样的规范化层，使其仅标准化特征而不标准化标签？

我已经完成了一个步骤，即从数据集中删除批次，这样如果我想获得相同的结果，我需要指定我正在批处理：

for example_inputs, example_labels in my_class_instance.train.batch(32).take(1):
  print(f'Inputs shape (batch, time, features): {example_inputs.shape}')
  print(f'Labels shape (batch, time, features): {example_labels.shape}')

回报：

Inputs shape (batch, time, features): (32, 6, 19) 
Labels shape (batch, time, features): (32, 1, 1)

Answer 1

你应该能够做这样的事情：

normalizer = tf.keras.layers.Normalization(axis=-1)
normalizer.adapt(my_class_instance.train.map(lambda x, y: x))
model.add(normalizer)

其中x代表您的特征， y代表您的标签。 提醒一下：

在归一化层上调用 adapt() 是在层构建期间传入均值和方差 arguments 的替代方法。

tf.data.Dataset 的规范化层

问题描述

1 个解决方案

解决方案1
1 已采纳 2022-08-22 17:16:11

tf.data.Dataset 的规范化层

问题描述

1 个解决方案

解决方案1 1 已采纳 2022-08-22 17:16:11

解决方案1
1 已采纳 2022-08-22 17:16:11