keras：将 ImageDataGenerator 和 KFold 用于 fit_generator 的问题

Question

flow_from_directory (directory)：它接收目录但不接收分割训练图像。

sklearn.model_selection.KFold：提供图像的分割索引。 这些可以在 fit() 中使用，但不能在 fit_generator() 中使用

如何将 KFold 与 ImageDataGenerator 一起使用？ 它在吗？

Answer 1

目前，无法使用flow_from_directory生成器拆分文件夹中保存的数据集。 这个选项根本没有实现。 要获得 test / train 拆分，需要使用 Python 中的os库将主目录拆分为一组 train / test / val 目录。

Answer 2

假设您有 2 个类的分类问题，我会执行以下操作：

from keras.utils import to_categorical  

train_y = to_categorical(train_y, num_classes=2)
test_y = to_categorical(test_y, num_classes=2)

aug = ImageDataGenerator(...) #your ImageDataGenerator

Model = model.fit_generator(aug.flow(train_x,tain_y, batch_size=32), 
            validation_data=(test_x,test_y))

Answer 3

对于遇到此问题的任何人：截至发布此答案的日期 - 我认为没有（至少相对）简单的开箱即用解决方案，并由我自己的搜索结果决定。

我想出的唯一解决方案是在我的项目中解决类似问题，是在我的数据集中进行分区，分区数等于折叠数，并将它们保存为字典，以分区数作为键和文件路径列出作为分区的值。 之后，您仍然需要将文件分别分类到用于训练和验证子集的类文件夹中。

例如：让 K=10。 算法可以这样描述：

将您的数据集划分为 10 个大小相同的分区。
取一个分区作为验证子集。 按类将其排序到所需的文件夹中。
其余分区应视为训练子集并分类到所需文件夹中。
为 val 和 train 子集创建 data_generators。
训练您的模型并使用您的架构保存它。
对每个其他分区重复上述步骤（将一个分区作为 val，训练其他分区），但现在您必须从保存文件加载模型。

恐怕此解决方案的代码片段（包括排序脚本和分区字典形成脚本）太大而无法在此处提供，但如有必要，我很乐意分享。

keras：将 ImageDataGenerator 和 KFold 用于 fit_generator 的问题

问题描述

3 个解决方案

解决方案1
1 2017-01-22 21:40:22

解决方案2
0 2018-03-29 01:10:40

解决方案3
0 2020-04-29 17:09:50

keras：将 ImageDataGenerator 和 KFold 用于 fit_generator 的问题

问题描述

3 个解决方案

解决方案1 1 2017-01-22 21:40:22

解决方案2 0 2018-03-29 01:10:40

解决方案3 0 2020-04-29 17:09:50

解决方案1
1 2017-01-22 21:40:22

解决方案2
0 2018-03-29 01:10:40

解决方案3
0 2020-04-29 17:09:50