簡體 English 中英

如果 output 層（標簽）由 one-hot 向量和零向量組成，使用什么損失 function？

[英]What loss function to use if the output layer (label) is composed of one-hot vectors and zero vectors?

原文 2019-11-16 06:50:12 4 1 machine-learning/ optimization/ keras/ deep-learning/ loss-function

我正在嘗試使用 TensorFlow 和 Keras 設計基於深度學習的分類 model。 在我的 model 中，label 是一個可變長度的序列，例如：ABC、CADB 或 ABCDB。

為簡單起見，在 output 層中，我使用固定長度（等於最長序列的長度）來存儲所有序列。 因此，如果序列的長度比固定長度短，則該序列由 one-hot 向量（對應於序列的實際長度）和零向量（對應於剩余長度）表示。

例如，如果固定長度為 5，則序列 CADB 由 4 * 5 矩陣表示，如下所示：

請注意：這個矩陣的前 4 列是 one-hot 向量，每個向量都有一個且只有一個 1 條目，其他所有條目都是 0。 但是最后一列的條目都是0，可以看做是補零，因為序列不夠長。

如果所有向量都是 one-hot 向量，分類交叉熵是損失 function 的不錯選擇。 但在我的情況下，一些向量（例如，上圖中的第 5 列）只有 0 個條目，並且分類交叉熵在這里不起作用。

所以我的問題是：在這種情況下使用什么損失 Function ？

1 個解決方案

這就是我所理解的：您的序列長度固定為 output。 例如，序列的最大長度為 10，那么最后一層 output 長度為 10。在某些情況下，生成的長度序列只有 4，在這種情況下，最后 6 個輸出將為 0。
這是一個多標簽多類分類問題。 由於您在最后一個 Dense 層中使用 Keras，您可以使用 sigmoid 激活，對於損失，您可以使用 binary_crossentropy。
雖然，不確定您使用的是哪種架構，但是在序列生成的情況下，RNN、LSTM 等序列模型可能是比簡單密集層更好的選擇。

將決策樹節點映射到一鍵向量的最快方法是什么？

[英]What is the fastest method to map decision tree nodes to one-hot vectors?

如何在TensorFlow中將字符串標簽轉換為單熱矢量？

[英]How to convert string labels to one-hot vectors in TensorFlow?

One-Hot 編碼的 Keras 自定義損失

[英]Keras Custom Loss for One-Hot Encoded

一個熱向量的keras模型輸出向量，有可能嗎？如果沒有，還有其他選擇嗎？

[英]keras model output vector of one hot vectors, is it possible? are there any alternatives if not?

不需要label的One-Hot編碼？

[英]One-Hot Encoding of label not needed?

如何添加一個熱向量？

[英]How to add one hot vectors?

如何使用帶有交叉熵損失的 one-hot 編碼？

[英]How do I use one-hot encoding with cross-entropy loss?

Keras：如何對 logits 進行一次熱編碼以匹配損失標簽 function

[英]Keras: How to one-hot encode logits to match labels for loss function

何時使用 one-hot 編碼以及何時使用整數/標簽編碼？

[英]When to use one-hot encoding and when to use integer/label encoding?

二進制數而不是一個熱向量

[英]Binary numbers instead of one hot vectors

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 將決策樹節點映射到一鍵向量的最快方法是什么？如何在TensorFlow中將字符串標簽轉換為單熱矢量？ One-Hot 編碼的 Keras 自定義損失一個熱向量的keras模型輸出向量，有可能嗎？如果沒有，還有其他選擇嗎？不需要label的One-Hot編碼？如何添加一個熱向量？如何使用帶有交叉熵損失的 one-hot 編碼？ Keras：如何對 logits 進行一次熱編碼以匹配損失標簽 function 何時使用 one-hot 編碼以及何時使用整數/標簽編碼？二進制數而不是一個熱向量

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM