簡體   English   中英

CNN 圖像分類,一條記錄有多個輸入圖像

[英]CNN Image Classification with multiple input images for one record

我有一個包含20,000輛汽車和80,000張圖像的數據集。

  • 每輛車由 4 張圖像表示。
  • 10,000輛汽車完好無損,沒有任何損壞(第一個文件夾)
  • 10,000 輛汽車受損,4 張圖片中至少有一張汽車有明顯損壞(第二個文件夾)

在我看來,我至少可以看到兩種方法:

  1. 從四個圖像創建一個大圖像並創建一個矩陣表示
  2. 創建一個輸入,其中一輛車(一次觀察)由 4 個輸入表示。
  3. 手動標記汽車損壞的圖像。

就我個人而言,我想使用選項2來 go - 但我不知道如何實現這個輸入。

我想像使用 RGB 通道時那樣堆疊圖像,但我知道 CNN 正在深入,所以我認為這可能會在訓練時引起一些問題。

還有另一種實現多圖像輸入的方法嗎? 所以對於一輛車(觀察/汽車)我可以指定四個不同的矩陣?

__

編輯:

我只有信息,這輛車被損壞了。 我現在知道哪些圖像包含損壞的部分。

使用 4 個通道的選項 2應該可以工作,但是從輸入和訓練的角度來看,它看起來過於復雜了。 選項 1也是如此。

對我來說,您似乎需要一種識別損壞汽車圖片的算法,對於此類任務,我認為最好的方法是在一個通道上進行訓練,標記每張圖像。

選項 3有很多優點:

  1. 將使 model 更小。
  2. 會讓訓練更輕松。
  3. 從 1 和 2 開始,您可以期望花費時間的准確性更高。
  4. 將使您的 model 對意外輸入更加穩健。

假設現在每輛車只有 2 或 5 張圖片,或者只是組中有一張不是汽車的圖片,使用頻道選項或“大矩陣”選項,您需要在頂部制定一些策略處理這些案件。

如果您改為制作一個通用的圖片碰撞識別算法,您可以在一輛汽車的 4 或 n 張圖片上運行它,只要其中一張顯示損壞,那么您就可以預測損壞。

主要缺點是標記 10k 圖片看起來像是一堆工作,但它們應該首先被逐張標記,而不是在 4 個圖片集群中。

其他選擇可能是開發一種無監督學習算法,該算法在不使用標簽的情況下發現損壞的未損壞汽車之間的差異,但這也可能使火車更難,如果您已經有標簽,model 會更復雜。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM