繁体   English   中英

Pytorch Dataloader 未将数据拆分为批次

[英]Pytorch Dataloader not spliting data into batch

我有这样的数据集 class:

class LoadDataset(Dataset):
    def __init__(self, data, label):
        self.data = data
        self.label = label
    def __len__(self):
        dlen = len(self.data)
        return dlen
    def __getitem__(self, index):
        return self.data, self.label

然后我加载具有 [485, 1, 32, 32] 形状的图像数据集

train_dataset = LoadDataset(xtrain, ytrain)
print(len(train_dataset))
# output 485

然后我用DataLoader加载数据

train_loader = DataLoader(train_dataset, batch_size=32)

然后我迭代数据:

for epoch in range(num_epoch):
        for inputs, labels in train_loader:   
            print(inputs.shape)

output 打印torch.Size([32, 485, 1, 32, 32]) ,它应该是torch.Size([32, 1, 32, 32])

谁能帮我?

__getitem__方法应该返回 1 个数据块,你返回了所有的数据块。

试试这个:

class LoadDataset(Dataset):
    def __init__(self, data, label):
        self.data = data
        self.label = label
    def __len__(self):
        dlen = len(self.data)
        llen = len(self.label)  # different here
        return min(dlen, llen)  # different here
    def __getitem__(self, index):
        return self.data[index], self.label[index]  # different here

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM