繁体   English   中英

如何从 Keras 提供的 MNIST 数据集中只选择特定数量的样本?

[英]How do I select only a specific number of samples from the MNIST dataset provided by Keras?

我目前正在使用 Keras 在 MNIST 数据集上训练卷积神经网络。 我正在使用格式加载数据集

(X_train, Y_train), (X_test, Y_test) = mnist.load_data()

但是为了减少对所有数据的迭代,我只想从每个 0-9 类中为X_train选择前 10000 个样本,类似地从Y_train 我怎样才能做到这一点?

MNIST 数据集说它返回:

Return:

    2 tuples:
        X_train, X_test: uint8 array of grayscale image data with shape (nb_samples, 28, 28).
        y_train, y_test: uint8 array of digit labels (integers in range 0-9) with shape (nb_samples,).

所以你只需要切片你想保留的部分。 我相信 pandas/numpy 的语法类似于:

X_train = X_train[:10000,:,:]
X_test = X_test[:10000,:,:]
y_train = y_train[:10000]
y_test  = y_test[:10000]
from keras.datasets import mnist

(x_train, y_train), (x_test, y_test) = mnist.load_data()

x_train = x_train[:1000,:,:]
x_test = x_test[:500,:,:]
y_train = y_train[:1000]
y_test  = y_test[:500]


print(len(x_train))
print(len(y_train))
print(len(x_test))
print(len(y_test))

#输出

> 1000 
> 1000 
> 500 
> 500

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM