簡體   English   中英

帶有 Sklearn 的 MNIST 數據集

[英]MNIST dataset with Sklearn

我在 MNIST 數據集上訓練線性 model,但我只想訓練一個數字,即 4。如何選擇我的 X_test、X_train、y_test、y_train?

您的分類器需要學會區分不同類別的集合。 如果您只關心數字 4,則應將訓練和測試集拆分為:

  • Class 4 個實例
  • 不是 class 4 個實例:所有其他數字的並集

否則,訓練/測試拆分仍然是典型的拆分,您希望沒有重疊。

如果只需要識別 4s 則屬於二分類問題,因此只需新建一個目標變量:如果 class 為 4,則 Y=1,如果 class 不為 4,則 Y=0。

  • Train_X 將保持不變
  • Train_Y 將是您與 Train_X 相關的新目標變量
  • Test_X 將保持不變
  • Test_Y 將是您與 Test_X 相關的新目標變量。 <\ul>

    數據會有點不平衡,但應該不是問題!

  • 暫無
    暫無

    聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

     
    粵ICP備18138465號  © 2020-2024 STACKOOM.COM