簡體   English   中英

TP、TN、FP 和 FN 的總數不等於觀測值的總數

[英]Total number of TP, TN, FP & FN do not sum up to total number of observed values

我正在閱讀 TensorFlow 對不平衡數據的分類。在本教程中,他們使用了Kaggle 的信用卡欺詐檢測 節中,您可以看到訓練樣本的數量為182276驗證樣本的數量為45569 為了評估基線 model,他們使用了 Keras 的內置指標——TruePositive、FalsePositive、TrueNegative、FalseNegative。

但是,如果您查看訓練model部分中的訓練日志,您會發現 FP+TP+FN+TN 的總和不等於訓練示例的數量。 總和也不等於驗證數據的驗證示例數。

第1部分

時代 1

TP = 64
FP = 25
TN = 139431.9780
FN = 188.3956
TP+FP+TN+FN = 139709.3736

上面的總和遠不及 182276。所有后續時期也是如此。 為什么會這樣?

第2部分

隨着epoch數量的增加,總和進一步減少。 例如,比較紀元 2 和紀元 1 的值。紀元2

TP - 25
FP - 5.67
TN - 93973.1538
FN - 136.2967 
TP+FP+TN+FN = 94135.1205

總和現在進一步減少了 45574。對於順序較低的時代也是如此。

  1. 總和不應該是一樣的嗎?
  2. 如果不是那么為什么它繼續減少?

第 3 部分

為什么 TP、FP、FN、TN 的值在訓練和驗證中都是浮點數? 根據我的理解,這些值應該始終為 integer。根據理解有用指標中的解釋,這些值表示計數,因此應該是整數。

我正在通過 TensorFlow 對不平衡數據進行分類。 在本教程中,他們使用了Kaggle 的信用卡欺詐檢測 節中,您可以看到訓練樣本的數量為182276驗證樣本的數量為45569 為了評估基線 model,他們使用了 Keras 的內置指標——TruePositive、FalsePositive、TrueNegative、FalseNegative。

但是,如果您查看train model部分中的訓練日志,您會發現 FP+TP+FN+TN 的總和不等於訓練示例的數量。 總和也不等於驗證數據的驗證示例數。

第1部分

紀元 1

TP = 64
FP = 25
TN = 139431.9780
FN = 188.3956
TP+FP+TN+FN = 139709.3736

上述總和遠不接近 182276。所有后續時期也是如此。 為什么會這樣?

第2部分

隨着 epoch 數量的增加,總和進一步減少。 例如,比較 epoch 2 和 1 的值。EPOCH 2

TP - 25
FP - 5.67
TN - 93973.1538
FN - 136.2967 
TP+FP+TN+FN = 94135.1205

現在總和進一步減少了 45574。對於低階的時期也是如此。

  1. 總和不應該一樣嗎?
  2. 如果不是那么為什么它會繼續下降?

第 3 部分

為什么訓練和驗證中 TP、FP、FN、TN 的值都是浮點數? 根據我的理解,這些應該始終是 integer。 根據理解有用指標中的解釋,這些值表示計數,因此應該是整數。

我遇到了類似的問題,TP、TN、FP 和 FN 的總和在每個時期翻了一番,並且不是整數。 我的解決方案是我的 model 是使用張量流 keras 構建的,但我直接導入了 keras。

所以而不是

import keras

采用

from tensorflow import keras

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM