[英]loading data in GPU before starting training in Google Colab
我在我的 Google 驅動器上使用 PlantVillage(圖像)數據集的一個子集,並嘗試根據來自 Google Colab 的數據訓練 CNN 模型(當然,我使用 GPU)。 問題是,第一個訓練周期非常緩慢,因為數據是第一次加載到 GPU 中。 后面的回合移動得更快,並且在可預測的時間范圍內。 現在,是否可以在訓練之前進行加載並將其排除在外? 我想 %%time 我的訓練時間,在我的訓練中有這個額外的加載時間把事情搞砸了。
我使用 Tensorflow 和 Keras 應用程序進行數據預處理和 model 培訓。
您可以使用Dataset.cache()
和Dataset.prefetch()
,它們將從磁盤加載后將數據保留在 memory 中,並相對提高 model 的訓練速度。
檢查以下代碼:
AUTOTUNE = tf.data.AUTOTUNE
train_ds = train_ds.cache().prefetch(buffer_size=AUTOTUNE)
val_ds = val_ds.cache().prefetch(buffer_size=AUTOTUNE)
請查看此鏈接以供參考。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.