簡體   English   中英

使用 LSTM 進行文本分類時,分類報告效果不佳 model

[英]Classification report not working well while doing text classification with LSTM model

嘗試使用 LSTM 獲得關於文本數據和 label 的分類報告,該報告指出沒有 1,這是不正確的,因為 label 由 0 和 1 組成。

這是報告結果: 分類報告

nd 這是我為此目的所做的代碼:

 X_train, X_test, Y_train, Y_test = train_test_split(X,Y, test_size = 0.20) #lstm model model = Sequential() model.add(Embedding(MAX_NB_WORDS, EMBEDDING_DIM, input_length=X.shape[1])) model.add(SpatialDropout1D(0.2)) model.add(LSTM(100, dropout=0.2, recurrent_dropout=0.2)) model.add(Dense(4, activation='softmax')) model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy']) print(model.summary()) history = model.fit(X_train, Y_train, epochs=epochs, batch_size=batch_size,validation_split=0.1,callbacks=[EarlyStopping(monitor='val_loss', patience=3, min_delta=0.0001)]) Y_pred=model.predict(X_test) print(classification_report(Y_test.argmax(axis=1), Y_pred.argmax(axis=1)))

這是對報告的解釋錯誤:

  • 該報告確實說有 1為真 label的實例,您可以從顯示 164883 個實例(超過一半)的“支持”列中看到這一點。
  • 然而,對於 class 1,性能到處都是零:這意味着分類器永遠不會預測 class 這顯然是一個完全錯誤的跡象。

注意:文本分類任務很少是平衡的。 如果涉及任何重采樣,則對重采樣數據進行評估將是錯誤的。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM