繁体 English 中英

在Tensorflow中的多类别分类中限制输出类别

[英]Restricting output classes in multi-class classification in Tensorflow

原文 2016-07-25 15:42:45 0 1 classification/ tensorflow/ text-classification

我正在构建双向LSTM以进行多类句子分类。 我总共有13个类别可供选择，并且我将LSTM网络的输出乘以一个维度为[2*num_hidden_unit,num_classes]的矩阵，然后应用softmax获得该句子落入13个[2*num_hidden_unit,num_classes]中的1个的概率类。

因此，如果我们将output[-1]视为网络输出：

W_output = tf.Variable(tf.truncated_normal([2*num_hidden_unit,num_classes])) result = tf.matmul(output[-1],W_output) + bias

我得到了[1, 13]矩阵（假设我暂时不使用批处理）。

现在，我还知道，给定句子肯定不会属于给定类别，并且我想限制给定句子考虑的类别数量。 举例来说，对于给定的句子，我知道它只能分为6类，因此输出实际上应该是维度矩阵[1,6] 。

我想到的一个选择是在result矩阵上放置一个掩码，在该矩阵上，我将要保留的类对应的行乘以1，将要丢弃的类对应的行乘以0，这样我将丢失一些信息，而不是重定向信息。

任何人都知道在这种情况下该怎么办？

1 个解决方案

我认为，最好的选择是，如您所描述的，使用加权交叉熵损失函数，其中“不可能的类别”的权重为0，其他可能类别的权重为1。 Tensorflow具有加权交叉熵损失函数。

另一种有趣但可能效果不佳的方法是提供您现在掌握的任何信息，这些信息可以使您的句子在某个时间点（可能即将结束）可以/不能进入网络。

WEKA中的多类别分类

[英]Multi-Class Classification in WEKA

多类分类中的类不平衡问题

[英]class imbalance issue in multi-class classification

多类分类的 Sigmoid 激活？

[英]Sigmoid activation for multi-class classification?

计算多类分类的准确度

[英]Calculating accuracy for multi-class classification

高斯过程多类分类

[英]Gaussian process multi-class classification

大型数据库的多类分类（matlab）

[英]Multi-class classification for large database (matlab)

使用 scikit learn 训练逻辑回归进行多类分类

[英]Training logistic regression using scikit learn for multi-class classification

如何在多类分类中计算不平衡精度度量

[英]How to calculate Imbalance Accuracy Metric in multi-class classification

大型多类NLP分类的数据和样本量不平衡

[英]Imbalanced data and sample size for large multi-class NLP classification

在 Caffe 中 HDF5 数据的多类分类

[英]Multi-Class Classification in Caffe of HDF5 data

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 WEKA中的多类别分类多类分类中的类不平衡问题多类分类的 Sigmoid 激活？计算多类分类的准确度高斯过程多类分类大型数据库的多类分类（matlab）使用 scikit learn 训练逻辑回归进行多类分类如何在多类分类中计算不平衡精度度量大型多类NLP分类的数据和样本量不平衡在 Caffe 中 HDF5 数据的多类分类

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM