Tensorflow RNN用于单输出分类

Question

我想在Tensorflow中创建一个RNN，对短文本进行分类，并根据每个字母对它们进行分析。 为此，我创建了一个numpy的2D数组，其中每个文本都被填充或截断，其中每个元素都是一个字符代码。 输出只是表示为一热编码的numpy 2D数组的clases的向量。

这是一个例子：

train_x.shape, train_y.shape

（（91845，50），（91845，5））

输入由90K行组成，每行50个字符，输出为90K行，具有5个类。 接下来，我要构建一个网络，如下图所示。

该结构看起来很琐碎，但我绝对缺乏Tensorflow方面的知识，并且在尝试至少进行培训时遇到各种问题。 这是我用来构建网络的代码部分

chars = sequence_categorical_column_with_identity('chars', params['domain_size']+1)
chars_emb = tf.feature_column.embedding_column(chars, dimension=10)
columns = [chars_emb]

input_layer, sequence_length = sequence_input_layer(features, columns)

hidden_units = 32
lstm = tf.nn.rnn_cell.LSTMCell(hidden_units, state_is_tuple=True)
rnn_outputs, state = tf.nn.dynamic_rnn(lstm, 
                                      inputs = input_layer,
                                      sequence_length=sequence_length,
                                      dtype=tf.float32)

output = rnn_outputs[:,-1,:]
logits = tf.layers.dense(output, params['n_classes'], activation=tf.nn.tanh)
# apply projection to every timestep.
# Compute predictions.
predicted_classes = tf.nn.softmax(logits)

# Compute loss.

loss = tf.nn.softmax_cross_entropy_with_logits_v2(labels=labels, logits=logits)
# Compute evaluation metrics.
accuracy = tf.metrics.accuracy(labels=labels,
                               predictions=predicted_classes,
                               name='acc_op')

但我得到一个错误

InvalidArgumentError (see above for traceback): Input to reshape is a tensor with 8 values, but the requested shape has 1
     [[Node: Reshape = Reshape[T=DT_FLOAT, Tshape=DT_INT32, _device="/job:localhost/replica:0/task:0/device:CPU:0"](softmax_cross_entropy_with_logits, sequence_input_layer/chars_embedding/assert_equal/Const)]]

您可以在此处找到更完整的最小示例。 您很有可能需要Tensorflow 1.8.0。

Answer 1

新增中

loss = tf.reduce_mean(loss)

现在可以训练网络，但效果不佳。

Tensorflow RNN用于单输出分类

问题描述

1 个解决方案

解决方案1
0 2018-05-10 12:30:30

Tensorflow RNN用于单输出分类

问题描述

1 个解决方案

解决方案1 0 2018-05-10 12:30:30

解决方案1
0 2018-05-10 12:30:30