[英]Pandas HDFStore caching
我正在使用一個中等大小的數據集,其中包含大約 150 個 HDF 文件,每個文件 0.5GB。 有一個預定的進程使用store.append
的pd.HDFStore
更新這些文件。
我正在嘗試實現以下場景:對於 HDF 文件:
現在,這工作正常,因為我們可以擁有任意數量的讀者,只要他們都處於只讀模式。 但是,在第 3 步中,由於 HDFStore 緩存了文件,因此它不會返回在連接打開后追加的行。 有沒有辦法在不重新打開商店的情況下選擇新添加的行?
在做了更多研究之后,我得出結論,這對於 HDF 文件是不可能的。 實現上述功能的唯一可靠方法是使用數據庫(SQLite 最接近 - 讀/寫速度低於 HDF,但仍比成熟的數據庫(如 Postgres 或 MySQL)快)。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.