Python和OpenCV中類似的圖像形狀轉換

Question

我是Python的新手，很難理解Python中的圖像形狀轉換。

在Python代碼中，圖像I has I.shape

ipdb> I.shape
(720, 1280, 3)

在Python中運行此命令將轉換I's shape並存儲到h5_image

 h5_image = np.transpose(I, (2,0,1)).reshape(data_shape)

其中data_shape是：

 ipdb> p data_shape
 (1, 3, 720, 1280)

Answer 1

您可以在python / numpy中將圖像（ I ）視為具有N個維度的矩陣。

這些是保存圖像數據的常用方法，但是當然，只要您知道如何讀取，就可以以任何喜歡的方式保存它。 例如，您可以將其作為一維矢量保持一個長矢量，還可以保留圖像的寬度和高度，因此您知道如何將其讀取為2D格式。

對於您更具體的問題：

我不確定您要尋找的輸出是什么。 您也可以在OpenCV中執行transpose（）或flip（）。
(1, 3, 720, 1280)僅表示您還有其他退化尺寸。 要訪問每個像素，您必須編寫I[1,channel,row,col] 。 1是不必要的，並且不是保存圖像陣列的常用方法。 為什么要這樣做？ 您要以特定格式保存嗎？ （HDF5？）
唯一的區別在於數據的排列方式。 例如，對於(3, 720, 1280) ，要獲得紅色通道，您需要編寫： red = I[0,:,:] 。 在(720, 1280, 3)的情況下，您需要編寫： red = I[:,:,0] （這是更常見的）。

*有些性能問題取決於您內存中圖像數據的實際排列方式，但是我認為您現在不需要關心這一點。