[英]loading data in GPU before starting training in Google Colab
我在我的 Google 驱动器上使用 PlantVillage(图像)数据集的一个子集,并尝试根据来自 Google Colab 的数据训练 CNN 模型(当然,我使用 GPU)。 问题是,第一个训练周期非常缓慢,因为数据是第一次加载到 GPU 中。 后面的回合移动得更快,并且在可预测的时间范围内。 现在,是否可以在训练之前进行加载并将其排除在外? 我想 %%time 我的训练时间,在我的训练中有这个额外的加载时间把事情搞砸了。
我使用 Tensorflow 和 Keras 应用程序进行数据预处理和 model 培训。
您可以使用Dataset.cache()
和Dataset.prefetch()
,它们将从磁盘加载后将数据保留在 memory 中,并相对提高 model 的训练速度。
检查以下代码:
AUTOTUNE = tf.data.AUTOTUNE
train_ds = train_ds.cache().prefetch(buffer_size=AUTOTUNE)
val_ds = val_ds.cache().prefetch(buffer_size=AUTOTUNE)
请查看此链接以供参考。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.