繁体   English   中英

Keras - LSTM 密集层中的输入形状错误

[英]Keras - Wrong input shape in LSTM dense layer

我试图建立一个lstm使用文本分类Keras

这是模型结构:

model_word2vec = Sequential()
model_word2vec.add(Embedding(input_dim=vocabulary_dimension,
                    output_dim=embedding_dim,
                    weights=[word2vec_weights,
                    input_length=longest_sentence,
                    mask_zero=True,
                    trainable=False))
model_word2vec.add(LSTM(units=embedding_dim, dropout=0.25, recurrent_dropout=0.25, return_sequences=True))
model_word2vec.add(Dense(3, activation='softmax'))
model_word2vec.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])


results = model_word2vec.fit(X_tr_word2vec, y_tr_word2vec, validation_split=0.16, epochs=3, batch_size=128, verbose=0)

其中y_tr_word2vec是一个 3 维的one-hot编码变量。

当我运行上面的代码时,我收到此错误:

ValueError: Error when checking model target: expected dense_2 to have 3 dimensions, but got array with shape (15663, 3)

我想问题可能与y_tr_word2vec形状或batch size ,但我不确定。

更新:

我已将return_sequences=False , y_tr_word2vecone-hot更改为categorical ,密集层中有1神经元,现在我使用sparse_categorical_crossentropy而不是categorical_crossentropy

现在,我收到此错误: ValueError: invalid literal for int() with base 10: 'countess'

因此,现在我认为,在fit()期间,包含句子的输入向量X_tr_word2vec出现问题。

问题是这段代码

model_word2vec.add(LSTM(units=dim_embedding, dropout=0.25, recurrent_dropout=0.25, return_sequences=True))
model_word2vec.add(Dense(3, activation='softmax'))

您已经设置return_sequences=True ,这意味着 LSTM 将返回一个 3D 数组到密集层,而密集不需要 3D 数据...所以删除 return_sequences=True

model_word2vec.add(LSTM(units=dim_embedding, dropout=0.25, recurrent_dropout=0.25))
model_word2vec.add(Dense(3, activation='softmax'))

你为什么设置 return_sequences=True?

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM