簡體   English   中英

保存/加載data.table的最快方法

[英]Fastest way to save/load data.table

我想要做的是實際使用最快的方法來存儲data.table s以便進一步處理。

有點像:

  1. 從CSV / RDS中讀取原始數據。
  2. 將其轉換為data.table
  3. 將其保存為為重新讀取而優化的格式(RDS似乎不適用於data.table ,是嗎?還有其他二進制選項嗎?)
  4. 繼續使用步驟#3中的文件,直接將其作為data.table讀取,進行切片,分組,繪圖,...

步驟3的最佳選擇是什么?

好的,這里是我正在使用的特定數據集的一些測量。 它最初是在RDS中,讀取它需要60多秒。

之后,DT被保存為內部XDR以及SQLite數據庫,兩者都是未壓縮的。

  1. save()/ load()對最快,加載11.7-11.8秒

  2. SQLite(dbReadTable)非常接近,12.0-12.1秒。 使用DB的文件大小減小了約30%,因此我可以想象SQLite比save()/ load()更快的情況。

現在save()/ load()適合我,它也保留了類

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM