Pytorch：如何將圖像塊轉換為特征向量矩陣？

Question

為了在 neural.network 中用作輸入，我想從圖像塊中獲取特征向量矩陣。 我正在使用 Fashion-MNIST 數據集（28x28 圖像）並使用 Tensor.unfold 通過以下方式獲取補丁（16 7x7 補丁）：

#example on one image
mnist_train = torchvision.datasets.FashionMNIST(
        root="../data", train=True, transform=transforms.Compose([transforms.ToTensor()]), download=True)
x = mnist_train[0][0][-1, :, :]
x = x.unfold(0, 7, 7).unfold(1, 7, 7)
x.shape
>>> torch.Size([4, 4, 7, 7])

在這里，我最終得到一個 4x4 張量的 7x7 補丁，但是我想對每個補丁進行矢量化以獲得具有維度的矩陣X （16：補丁數 xd：特征向量的維度）。 我不確定是否可以在這里使用 flatten() 以及我將如何使用它 go 。

Answer 1

要關閉它，請將評論的內容移至此處：

#example on one image
mnist_train = torchvision.datasets.FashionMNIST(
    root="../data", train=True, 
transform=transforms.Compose([transforms.ToTensor()]), download=True)
x = mnist_train[0][0][-1, :, :]
x = x.unfold(0, 7, 7).unfold(1, 7, 7)
x.shape

Output：

>>> torch.Size([4, 4, 7, 7])

然后：

x.reshape(-1,7,7)
x.shape

Output：

torch.Size([16,7,7])

Pytorch：如何將圖像塊轉換為特征向量矩陣？

問題描述

1 個解決方案

解決方案1
1 已采納 2022-04-07 13:31:59

Pytorch：如何將圖像塊轉換為特征向量矩陣？

問題描述

1 個解決方案

解決方案1 1 已采納 2022-04-07 13:31:59

解決方案1
1 已采納 2022-04-07 13:31:59