TP、TN、FP 和 FN 的總數不等於觀測值的總數

Question

我正在閱讀 TensorFlow 對不平衡數據的分類。在本教程中，他們使用了Kaggle 的信用卡欺詐檢測。 在本節中，您可以看到訓練樣本的數量為182276 ，驗證樣本的數量為45569 。 為了評估基線 model，他們使用了 Keras 的內置指標——TruePositive、FalsePositive、TrueNegative、FalseNegative。

但是，如果您查看訓練model部分中的訓練日志，您會發現 FP+TP+FN+TN 的總和不等於訓練示例的數量。 總和也不等於驗證數據的驗證示例數。

第1部分

時代 1

TP = 64
FP = 25
TN = 139431.9780
FN = 188.3956
TP+FP+TN+FN = 139709.3736

上面的總和遠不及 182276。所有后續時期也是如此。 為什么會這樣？

第2部分

隨着epoch數量的增加，總和進一步減少。 例如，比較紀元 2 和紀元 1 的值。紀元2

TP - 25
FP - 5.67
TN - 93973.1538
FN - 136.2967 
TP+FP+TN+FN = 94135.1205

總和現在進一步減少了 45574。對於順序較低的時代也是如此。

總和不應該是一樣的嗎？
如果不是那么為什么它繼續減少？

第 3 部分

為什么 TP、FP、FN、TN 的值在訓練和驗證中都是浮點數？ 根據我的理解，這些值應該始終為 integer。根據理解有用指標中的解釋，這些值表示計數，因此應該是整數。

Answer 1

我正在通過 TensorFlow 對不平衡數據進行分類。 在本教程中，他們使用了Kaggle 的信用卡欺詐檢測。 在本節中，您可以看到訓練樣本的數量為182276 ，驗證樣本的數量為45569 。 為了評估基線 model，他們使用了 Keras 的內置指標——TruePositive、FalsePositive、TrueNegative、FalseNegative。

但是，如果您查看train model部分中的訓練日志，您會發現 FP+TP+FN+TN 的總和不等於訓練示例的數量。 總和也不等於驗證數據的驗證示例數。

第1部分

紀元 1

TP = 64
FP = 25
TN = 139431.9780
FN = 188.3956
TP+FP+TN+FN = 139709.3736

上述總和遠不接近 182276。所有后續時期也是如此。 為什么會這樣？

第2部分

隨着 epoch 數量的增加，總和進一步減少。 例如，比較 epoch 2 和 1 的值。EPOCH 2

TP - 25
FP - 5.67
TN - 93973.1538
FN - 136.2967 
TP+FP+TN+FN = 94135.1205

現在總和進一步減少了 45574。對於低階的時期也是如此。

總和不應該一樣嗎？
如果不是那么為什么它會繼續下降？

第 3 部分

為什么訓練和驗證中 TP、FP、FN、TN 的值都是浮點數？ 根據我的理解，這些應該始終是 integer。 根據理解有用指標中的解釋，這些值表示計數，因此應該是整數。

Answer 2

我遇到了類似的問題，TP、TN、FP 和 FN 的總和在每個時期翻了一番，並且不是整數。 我的解決方案是我的 model 是使用張量流 keras 構建的，但我直接導入了 keras。

所以而不是

import keras

采用

from tensorflow import keras

TP、TN、FP 和 FN 的總數不等於觀測值的總數

問題描述

第1部分

第2部分

第 3 部分

1 個解決方案

解決方案1
0 2021-01-13 10:01:40

第1部分

第2部分

第 3 部分

解決方案2
0 2021-06-19 03:52:39

TP、TN、FP 和 FN 的總數不等於觀測值的總數

問題描述

第1部分

第2部分

第 3 部分

1 個解決方案

解決方案1 0 2021-01-13 10:01:40

第1部分

第2部分

第 3 部分

解決方案2 0 2021-06-19 03:52:39

解決方案1
0 2021-01-13 10:01:40

解決方案2
0 2021-06-19 03:52:39