[英]Cloud Storage Buckets for PyTorch
对于我正在处理的特定任务,我有大约25 GB的数据集。 我仍在尝试几种预处理方法,并且肯定还没有将其数据保存为最终形式。 我不确定这类问题的通用工作流程是什么,所以这就是我的想法:
替代方法是这样的:
建议使用哪种方法? 这将产生较少的费用,并且在执行此类操作时最常使用。 我在这里没有看到其他工作流程吗?
在计费方面,费用将是相同的,因为根据文档 ,与其他Cloud Storage接口一样,对保险丝操作进行收费。 在您的用例中,我不知道您将如何训练数据,但是如果对文件进行多个操作,最好将它们下载,本地训练然后上传最终结果,即2对象操作。 例如,如果在培训期间进行了多个更改或读取了文件,则每个操作都将是对象操作。 在工作流方面,提出的建议对我来说很好。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.