簡體   English   中英

在 Google Colab 中開始訓練之前加載數據到 GPU

[英]loading data in GPU before starting training in Google Colab

我在我的 Google 驅動器上使用 PlantVillage(圖像)數據集的一個子集,並嘗試根據來自 Google Colab 的數據訓練 CNN 模型(當然,我使用 GPU)。 問題是,第一個訓練周期非常緩慢,因為數據是第一次加載到 GPU 中。 后面的回合移動得更快,並且在可預測的時間范圍內。 現在,是否可以在訓練之前進行加載並將其排除在外? 我想 %%time 我的訓練時間,在我的訓練中有這個額外的加載時間把事情搞砸了。

我使用 Tensorflow 和 Keras 應用程序進行數據預處理和 model 培訓。

您可以使用Dataset.cache()Dataset.prefetch() ,它們將從磁盤加載后將數據保留在 memory 中,並相對提高 model 的訓練速度。

檢查以下代碼:

AUTOTUNE = tf.data.AUTOTUNE

train_ds = train_ds.cache().prefetch(buffer_size=AUTOTUNE)
val_ds = val_ds.cache().prefetch(buffer_size=AUTOTUNE)

請查看此鏈接以供參考。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM