繁体 English 中英

为具有内存限制的神经网络训练高效创建 HDF5 图像数据集

[英]Efficiently Create HDF5 Image Dataset for Neural Network Training with Memory Limitations

原文 2019-03-07 16:32:54 4 1 python/ image/ pytorch/ hdf5/ h5py

我有大的图像数据集来训练 CNN。 由于我无法将所有图像加载到我的 RAM 中，我计划将它们转储到 HDF5 文件中（使用 h5py），然后按照建议批量迭代该集合

为 PyTorch 使用大型数据集的最有效方法？

我尝试为位于同一组中的每张图片创建自己的数据集，这非常快。 但我无法想出遍历组中的所有数据集，除了通过其名称访问该集。 作为替代方案，我尝试通过扩展其形状将所有图像迭代地放入一个数据集中，根据

如何使用 h5py 将数据附加到 hdf5 文件中的一个特定数据集和

使用 h5py 增量写入 hdf5

但这很慢。 有没有更快的方法来创建一个 HDF5 数据集来迭代？

1 个解决方案

我意识到这是一个老问题，但我发现了一个关于这个主题的非常有用的资源，我想分享：

https://www.oreilly.com/library/view/python-and-hdf5/9781491944981/ch04.html

基本上，hdf5（启用了块）就像一个小文件系统。 它将数据存储在分散在整个内存中的块中。 因此，就像文件系统一样，它受益于局部性。 如果块的形状与您尝试访问的数组部分的形状相同，则读取/写入速度会很快。 如果您要查找的数据分散在多个块中，则访问速度会很慢。

因此，在对图像训练 NN 的情况下，您可能必须将图像设为标准尺寸。 在创建数据集时设置chunks=(1,) + image_shape ，或者甚至更好， chunks=(batch_size,) + image_shape ，读/写会快很多。

无法在 Python 中创建 HDF5 数据集的引用

[英]Unable to create reference of HDF5 dataset in Python

如何读取 .hdf5 数据文件作为卷积神经网络的输入？

[英]how to read .hdf5 datafile as input to a convolutional neural network?

如何使用NumPy ndarray从HDF5数据集共享内存

[英]How to share memory from an HDF5 dataset with a NumPy ndarray

将数据集转换为HDF5数据集

[英]Converting a dataset into an HDF5 dataset

带有少量数据集的浅层神经网络的训练速度

[英]Training speed on a shallow neural network with a small dataset

如何从 numpy 数据集文件创建 hdf5 文件

[英]how to create hdf5 file from numpy dataset files

HDF5链接到数据集中的事件

[英]HDF5 Links to Events in Dataset

如何在Keras中训练HDF5文件中存储的数据的神经网络？

[英]How do I train a neural network in Keras on data stored in HDF5 files?

如何准备数据集以训练孪生神经网络

[英]how to prepare the dataset for the purpose of training a siamese neural network

具有成人收入数据集的神经网络训练精度低

[英]low training accuracy of a neural network with adult income dataset

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 无法在 Python 中创建 HDF5 数据集的引用如何读取 .hdf5 数据文件作为卷积神经网络的输入？如何使用NumPy ndarray从HDF5数据集共享内存将数据集转换为HDF5数据集带有少量数据集的浅层神经网络的训练速度如何从 numpy 数据集文件创建 hdf5 文件 HDF5链接到数据集中的事件如何在Keras中训练HDF5文件中存储的数据的神经网络？如何准备数据集以训练孪生神经网络具有成人收入数据集的神经网络训练精度低

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM