在 Tensorflow 中使用 Keras 的非常简单的 CNN model 精度太低

Question

我是 TensorFlow 的新手，因此不胜感激。 我的 model 的 output 与输入相同，只是形状不同，所以我预计精度为 1，但我得到的是 0.0062。

输入

我的数据集的每个输入都是 (19, 19, 1) 的形状。 对于这些输入中的每一个，只有一个随机单个值设置为 1，而 rest 为 0。示例但带有 (4, 4, 1)：

# [[0, 0, 0, 0],
#  [0, 1, 0, 0],
#  [0, 0, 0, 0],
#  [0, 0, 0, 0]

输出

每个 output 的形状为 (361)，本质上是其输入的扁平版本，因此理论上达到 1 的精度应该不是问题。 例子：

# [0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]

我的数据集由 2404 个这些样本组成。

这是我的代码。 请注意，我尝试了不同损失函数和优化器的组合：

model = models.Sequential()
model.add(layers.Conv2D(1, (1, 1), activation='relu', padding='same', input_shape=(19, 19, 1)))
model.add(layers.Flatten())
model.add(layers.Dense(19 * 19, activation='softmax'))
model.compile(
    optimizer='adam',
    loss=tf.keras.losses.Huber(),
    metrics=['accuracy']
)

dataset = Dataset()
inputs = dataset.input
outputs = dataset.output

model.fit(
    inputs, # (2404, 19, 19, 1)
    outputs, # (2404, 361)
    epochs=1000,
    shuffle=True,
    verbose=1
)

结果

它很快达到 0.0062 并保持在那里。

Epoch 10/1000
76/76 [==============================] - 0s 2ms/step - loss: 0.0014 - accuracy: 0.0062

更新 1 - 稍微好一点

谢谢您的帮助。 在我的代码中删除随机数的使用并禁用随机播放后，它开始在我运行代码的时间达到 1.00 50% 的准确度。 其他 50% 的峰值精度为 0.0046。 当我尝试将权重和偏差初始化为 0 时，它在 0.0046 100% 的时间达到峰值。 更新我所有的 TF 包几乎解决了这个问题，现在 90% 的时间都成功了。

Answer 1

从评论中得出答案。 您正在对 1x1 kernel 进行卷积，然后将其传递给密集层。 您希望网络学习的理想参数是密集层中的所有权重都是 kernel 值的倒数。 不过，这里最重要的是您通常会通过零。 密集层中的任何权重值，应用于零会导致另一个零，因此零会导致梯度消失。

当您将权重初始化为零时，这会将您的输入向量变为全零，全零总是结束学习。 不能反向传播。 当您不对初始化做任何事情时，TF 使用正态分布进行初始化，以 0 为中心。一半时间，初始化的 kernel 值为负数。 卷积后，你得到全零和一个负数。 在 relu 之后你全为零。 它可以学习的时间有一半——因为偶然它用正的 kernel 值初始化，而一半的时间不能。

尝试这个：

initializer = tf.keras.initializer.Ones()
model.add(layers.Conv2D(1, (1, 1), kernel_initializer=initializer, activation='relu', padding='same', input_shape=(19, 19, 1)))

在 Tensorflow 中使用 Keras 的非常简单的 CNN model 精度太低

问题描述

更新 1 - 稍微好一点

1 个解决方案

解决方案1
0 2021-05-13 16:51:46

在 Tensorflow 中使用 Keras 的非常简单的 CNN model 精度太低

问题描述

更新 1 - 稍微好一点

1 个解决方案

解决方案1 0 2021-05-13 16:51:46

解决方案1
0 2021-05-13 16:51:46