![](/img/trans.png)
[英]How to convert a folder of images into X and Y batches with Keras?
[英]Using Keras APIs, how can I import images in batches with exactly K instances of each ID in a given batch?
我正在尝试实现批量硬三元组丢失,如https://arxiv.org/pdf/2004.06271.pdf的第 3.2 节中所示。
我需要导入我的图像,以便每个批次在特定批次中都有每个 ID 的 K 个实例。 因此,每个批次必须是 K 的倍数。
我的图像目录太大而无法放入 memory 中,因此我使用ImageDataGenerator.flow_from_directory()
导入图像,但我看不到此 function 的任何参数以允许我需要的功能。
如何使用 Keras 实现此批处理行为?
从 Tensorflow 2.4 开始,我看不到使用ImageDataGenerator
的标准方法。
所以我认为你需要根据tensorflow.keras.utils.Sequence
class自己编写,所以你可以自由定义批处理内容。
参考:
https://www.tensorflow.org/api_docs/python/tf/keras/utils/Sequence
https://stanford.edu/~shervine/blog/keras-how-to-generate-data-on-the-fly
您可以尝试以受控方式将多个数据流合并在一起。
假设您有 K 个负责提供特定 ID 的训练实例的tf.data.Dataset
实例(无论您如何实例化它们),您可以将它们连接起来以在小批量中均匀分布:
ds1 = ... # Training instances with ID == 1
ds2 = ... # Training instances with ID == 2
...
dsK = ... # Training instances with ID == K
train_dataset = tf.data.Dataset.zip((ds1, ds2, ..., dsK)).flat_map(concat_datasets).batch(batch_size=N * K)
其中concat_datasets
是合并 function:
def concat_datasets(*datasets):
ds = tf.data.Dataset.from_tensors(datasets[0])
for i in range(1, len(datasets)):
ds = ds.concatenate(tf.data.Dataset.from_tensors(datasets[i]))
return ds
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.