繁体   English   中英

在 Google Colab 中开始训练之前加载数据到 GPU

[英]loading data in GPU before starting training in Google Colab

我在我的 Google 驱动器上使用 PlantVillage(图像)数据集的一个子集,并尝试根据来自 Google Colab 的数据训练 CNN 模型(当然,我使用 GPU)。 问题是,第一个训练周期非常缓慢,因为数据是第一次加载到 GPU 中。 后面的回合移动得更快,并且在可预测的时间范围内。 现在,是否可以在训练之前进行加载并将其排除在外? 我想 %%time 我的训练时间,在我的训练中有这个额外的加载时间把事情搞砸了。

我使用 Tensorflow 和 Keras 应用程序进行数据预处理和 model 培训。

您可以使用Dataset.cache()Dataset.prefetch() ,它们将从磁盘加载后将数据保留在 memory 中,并相对提高 model 的训练速度。

检查以下代码:

AUTOTUNE = tf.data.AUTOTUNE

train_ds = train_ds.cache().prefetch(buffer_size=AUTOTUNE)
val_ds = val_ds.cache().prefetch(buffer_size=AUTOTUNE)

请查看此链接以供参考。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM