簡體   English   中英

我可以在 Python 的臨時工作庫中導入/存儲數據文件嗎?

[英]Can I import/store data files in a temp work library in Python?

我想使用 .xlsx 文件,我嘗試了內置的open()和 pandas pd.read_excel()函數,這兩個函數都有效,但我每次都必須將它們包含在構建中並重新導入大型數據文件需要很多時間。

我更熟悉 SAS ,您可以在其中將文件提交到 WORK 庫,是否有與 Python 類似的東西,也許我可以使用 package?

您基本上有 2 個選項來序列化數據並將其存儲在文件中

泡菜文件:每個文件一個 dataframe

df = pd.read_pickle('data.pkl')
df.to_pickle('data.pkl')

hdf5文件:每個文件有多個數據幀

df = pd.read_hdf('data.h5', 'myframe')
df.to_hdf('data.h5', 'myframe')

這兩種方法都比使用“xlsx”文件快得多,使用更少的磁盤空間並保留您的對象結構和數據類型。 我猜 hdf5 更像是您對“庫”的想法。

請參閱: Pandas HDF5(PyTables)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM