使用神经网络的文本分类

Question

我是机器学习和神经网络的新手。 我正在尝试从头开始使用神经网络进行文本分类。 在我的数据集中，有7500个文档，每个文档都标有七个类别之一。 大约有5800个独特的单词。 我正在使用具有4000个神经元的隐藏层。 使用乙状结肠激活功能。 学习率= 0.1，无辍学。

训练期间大约2到3个时期后，将显示警告：

RuntimeWarning：exp中遇到溢出，结果输出列表显示为：

[  0.00000000e+00   0.00000000e+00   0.00000000e+00   0.00000000e+00
   0.00000000e+00   0.00000000e+00   4.11701866e-10]  for every input except 4.11701866e-10.

乙状结肠功能：

def sigmoid(x):    
   output = 1/(1+np.exp(-x))
   return output

def sigmoid_output_to_derivative(output):
   return output*(1-output)

如何解决此问题？我可以使用其他激活功能吗？

这是我的完整代码： https : //gist.github.com/coding37/a5705142fe1943b93a8cef4988b3ba5f

Answer 1

给出准确的答案并不容易，因为问题可能是多方面的，并且很难重构，但我将尝试一下：

因此，似乎您正在经历下溢，这意味着神经元的权重将输入向量x缩放为将导致S形函数为零的值。 一个幼稚的建议是将精度从float32提高到float64，但是我想您已经达到了这个精度。

您是否曾尝试过学习率和/或尝试过自适应学习率？ （有关某些示例，请参见https://towardsdatascience.com/learning-rate-schedules-and-adaptive-learning-rate-methods-for-deep-learning-2c8f433990d1 ）。 可以尝试以较低的学习率进行更多迭代。

另外：您是否在输出层中使用Sigmoid函数？ 增加的非线性会驱动您的神经元饱和，即您的问题。

您检查过渐变吗？ 有时，这有时还有助于跟踪错误（ http://ufldl.stanford.edu/wiki/index.php/Gradient_checking_and_advanced_optimization ）。

另外，您可以尝试使用其他激活功能（例如，线性启动）来提高自己的训练水平。

Answer 2

由于机器学习的概率往往很小，并且对其进行的计算会导致更小的值（导致下溢错误），因此，最好使用对数值进行计算 。

使用float64类型也不错，但最终也会失败。

因此，与其将两个小概率相乘，不如将其对数值相加。 其他操作（例如exp（））也是如此。

我知道的每个机器学习框架默认都会返回对数模型参数，或者有一个方法。 或者，您仅使用内置的数学函数。

使用神经网络的文本分类

问题描述

2 个解决方案

解决方案1
0 已采纳 2018-02-15 10:51:29

解决方案2
0 2018-02-15 11:40:28

使用神经网络的文本分类

问题描述

2 个解决方案

解决方案1 0 已采纳 2018-02-15 10:51:29

解决方案2 0 2018-02-15 11:40:28

解决方案1
0 已采纳 2018-02-15 10:51:29

解决方案2
0 2018-02-15 11:40:28