繁体   English   中英

在 AI Platform (CMLE) 上使用 tensorflow_dataset 库

[英]Using tensorflow_dataset library on AI Platform (CMLE)

我正在使用 tesorflow_datasets 库作为 mnist 数据集在 GCP AI 平台上进行训练。 我正在使用 tf.gan 估算器。 我编写了一个使用 tfds 库读取 mnist 数据的输入管道。

import tensorflow_datasets as tfds
ds = tfds.load('mnist', split=self.split, shuffle_files=self.shuffle)

我已经在实例上使用相同的“tensorflow_datasets”库训练了我的 gan 模型,并且模型训练得很好。 我已将我的代码打包成包以在 AI Platform 上运行它。 在 AI Platform 上训练期间,训练卡住了警告,它显示,

Dataset mnist is hosted on GCS. It will automatically be downloaded to your local data
directory. If you'd instead prefer to read directly from our public GCS bucket.

尽管训练停滞不前,但消耗的 ML 单元仍在不断增加。

'tensorflow_datasets' 库接受一个参数 'data_dir'。 如果您在 GCP 上使用此库,建议使用“data_dir”,它会在已上传 tensorflow 数据集的位置进行存储。

import tensorflow_datasets as tfds
ds = tfds.load('mnist', split=self.split,shuffle_files=self.shuffle, \
     data_dir='gs://tfds-data/datasets')

希望这会。 您也可以检查此存储桶。 它是一个包含数据集的公共存储桶。

gsutil ls gs://tfds-data/datasets/

您可以看到所有数据集

gs://tfds-data/datasets/
gs://tfds-data/datasets/downloads/
gs://tfds-data/datasets/groove/
gs://tfds-data/datasets/mnist/
gs://tfds-data/datasets/nsynth/
gs://tfds-data/datasets/wikipedia/

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM