[英]CNN Image Classification with multiple input images for one record
我有一個包含20,000輛汽車和80,000張圖像的數據集。
在我看來,我至少可以看到兩種方法:
就我個人而言,我想使用選項2來 go - 但我不知道如何實現這個輸入。
我想像使用 RGB 通道時那樣堆疊圖像,但我知道 CNN 正在深入,所以我認為這可能會在訓練時引起一些問題。
還有另一種實現多圖像輸入的方法嗎? 所以對於一輛車(觀察/汽車)我可以指定四個不同的矩陣?
__
編輯:
我只有信息,這輛車被損壞了。 我現在知道哪些圖像包含損壞的部分。
使用 4 個通道的選項 2應該可以工作,但是從輸入和訓練的角度來看,它看起來過於復雜了。 選項 1也是如此。
對我來說,您似乎需要一種識別損壞汽車圖片的算法,對於此類任務,我認為最好的方法是在一個通道上進行訓練,標記每張圖像。
選項 3有很多優點:
假設現在每輛車只有 2 或 5 張圖片,或者只是組中有一張不是汽車的圖片,使用頻道選項或“大矩陣”選項,您需要在頂部制定一些策略處理這些案件。
如果您改為制作一個通用的圖片碰撞識別算法,您可以在一輛汽車的 4 或 n 張圖片上運行它,只要其中一張顯示損壞,那么您就可以預測損壞。
主要缺點是標記 10k 圖片看起來像是一堆工作,但它們應該首先被逐張標記,而不是在 4 個圖片集群中。
其他選擇可能是開發一種無監督學習算法,該算法在不使用標簽的情況下發現損壞的未損壞汽車之間的差異,但這也可能使火車更難,如果您已經有標簽,model 會更復雜。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.