keras模型中的nan损失值

Question

我有以下数据形状

X_Train.shape,Y_Train.shape
Out[52]: ((983, 19900), (983,))
X_Test.shape,Y_Test.shape
Out[53]: ((52, 19900), (52,))

我正在运行一个简单的二进制分类器，因为Y_train和Y_test可以是1或2

import  keras
import  tensorflow as tf
from keras import  layers
from keras.layers import Input, Dense
from keras.models import Model,Sequential
import numpy as np
from  keras.optimizers import  Adam

myModel = keras.Sequential([
    keras.layers.Dense(1000,activation=tf.nn.relu,input_shape=(19900,)),
    keras.layers.Dense(64, activation=tf.nn.relu),
    keras.layers.Dense(32, activation=tf.nn.relu),
    keras.layers.Dense(1, activation=tf.nn.softmax)
])

myModel.compile(optimizer='adam', loss='sparse_categorical_crossentropy',metrics=['accuracy'])
myModel.fit(X_Train, Y_Train, epochs=100,batch_size=1000)
test_loss,test_acc=myModel.evaluate(X_Test,Y_Test)

代码输出

训练损失和准确性

Epoch 1/100
983/983 [==============================] - 1s 1ms/step - loss: nan - acc: 0.4608
Epoch 2/100
983/983 [==============================] - 0s 206us/step - loss: nan - acc: 0.4873
Epoch 3/100
983/983 [==============================] - 0s 200us/step - loss: nan - acc: 0.4883
Epoch 4/100
983/983 [==============================] - 0s 197us/step - loss: nan - acc: 0.4883
Epoch 5/100
983/983 [==============================] - 0s 194us/step - loss: nan - acc: 0.4873
Epoch 6/100
983/983 [==============================] - 0s 202us/step - loss: nan - acc: 0.4863
Epoch 7/100
983/983 [==============================] - 0s 198us/step - loss: nan - acc: 0.4863
Epoch 8/100
983/983 [==============================] - 0s 194us/step - loss: nan - acc: 0.4883
Epoch 9/100
983/983 [==============================] - 0s 196us/step - loss: nan - acc: 0.4873
Epoch 10/100
983/983 [==============================] - 0s 198us/step - loss: nan - acc: 0.4873
Epoch 11/100
983/983 [==============================] - 0s 200us/step - loss: nan - acc: 0.4893
Epoch 12/100
983/983 [==============================] - 0s 198us/step - loss: nan - acc: 0.4873
Epoch 13/100
983/983 [==============================] - 0s 194us/step - loss: nan - acc: 0.4873
Epoch 14/100
983/983 [==============================] - 0s 197us/step - loss: nan - acc: 0.4883
Epoch 97/100
    983/983 [==============================] - 0s 196us/step - loss: nan - acc: 0.4893
Epoch 98/100
    983/983 [==============================] - 0s 199us/step - loss: nan - acc: 0.4883
Epoch 99/100
    983/983 [==============================] - 0s 193us/step - loss: nan - acc: 0.4883
Epoch 100/100
    983/983 [==============================] - 0s 196us/step - loss: nan - acc: 0.4863

测试损失和准确性

test_loss,test_acc
Out[58]: (nan, 0.4615384661234342)

我还检查了我的数据中是否有nan值

np.isnan(X_Train).any()
Out[5]: False
np.isnan(Y_Train).any()
Out[6]: False
np.isnan(X_Test).any()
Out[7]: False
np.isnan(Y_Test).any()
Out[8]: False

我的问题是，为什么我的训练精度没有提高，为什么损耗不大？为什么没有一键编码，输出中的softmax也能正常工作？

注意1：我很抱歉我的数据很大，所以我不能在这里共享它，但是如果有某种方法可以在这里共享它，那么我准备好了。

注意2我的训练数据中有很多零值

Answer 1

有时与Relu结合使用Relu和Softmax会造成数值麻烦，因为Relu可以产生与非常小的概率相对应的大正值。

尝试使用tanh代替Relu

Answer 2

如果您丢失的NaN值，则表示输入在函数域之外。 发生这种情况的原因有多种。 以下是找出原因的几个步骤，

1）如果输入不在功能域内，则确定这些输入是什么。 跟踪输入值到成本函数的进度。

2）检查输入数据集中是否有任何null或nan值。 可以通过完成

DataFrame.isnull().any()

3）更改输入数据的比例。 将数据标准化为0和1之间的值即可开始训练。

4）权重初始化的变更方法。

使用深度神经网络很难指出确切的解决方案。 因此，尝试上述方法，它应该使您对发生的问题有一个清晰的了解。

Answer 3

在这里，Softmax激活不是正确的选择。 您在输出层上只有一个神经元。

让我们考虑一下如何定义softmax函数。（图片来自wikepedia.org）

。
由于最后一层只有一个神经元， 西格玛（z_i） 对于的所有值将为1 z_i 。

由于您正在使用sparse_categorical_crossentropy ，因此keras（或tensorflow）可以从logit的形状推断类的数量。 在keras（或tensorflow）中，logit的形状假定为[BATCH_SIZE，NUM_CLASSES] 。 您的logit的形状为[None，1]，因此keras假设您的班级数量为1，但是您正在喂食多个班级（0或1），这会导致错误。

此处的正确激活函数是Sigmoid（tanh也可以通过将数据集目标更改为-1或1来工作）。 损失应该是binary_crossentropy 。

myModel = keras.Sequential([
    keras.layers.Dense(1000,activation=tf.nn.relu,input_shape=(19900,)),
    keras.layers.Dense(64, activation=tf.nn.relu),
    keras.layers.Dense(32, activation=tf.nn.relu),
    keras.layers.Dense(1, activation="sigmoid")
])

myModel.compile(optimizer='adam', loss='binary_crossentropy',metrics=['accuracy'])

keras模型中的nan损失值

问题描述

3 个解决方案

解决方案1
2 2019-05-20 10:03:48

解决方案2
1 2019-05-20 10:02:22

解决方案3
1 2019-05-20 13:12:50

keras模型中的nan损失值

问题描述

3 个解决方案

解决方案1 2 2019-05-20 10:03:48

解决方案2 1 2019-05-20 10:02:22

解决方案3 1 2019-05-20 13:12:50

解决方案1
2 2019-05-20 10:03:48

解决方案2
1 2019-05-20 10:02:22

解决方案3
1 2019-05-20 13:12:50