簡體   English   中英

如何保存已經在Google Colab筆記本中加載和處理的數據,而不必每次都重新加載?

[英]How to save your data you've already loaded and processed in Google Colab notebook so you don't have to reload it everytime?

我已經從pickle庫中閱讀了有關“棘手”的信息,但是這是否僅保存您訓練過的模型,而不是保存例如從龐大的csv文件加載到變量中的實際數據框?

該示例筆記本中有一些保存和加載數據的不同方法的示例。

實際上,您可以使用pickle保存任何Python對象,包括Pandas數據幀,但是使用Pandas的方法之一pandas.DataFrame.to_csvto_feather等進行序列化更為常見。

我可能會推薦使用GCS命令行工具的選項,您可以在筆記本內部通過添加!作為前綴來運行它!

import pandas as pd
# Create a local file to upload.
df = pd.DataFrame([1,2,3])
df.to_csv("/tmp/to_upload.txt")

# Copy the file to our new bucket.
# Full reference: https://cloud.google.com/storage/docs/gsutil/commands/cp
!gsutil cp /tmp/to_upload.txt gs://my-bucket/

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM