[英]Is there a way to read in a large document as a data.frame in R?
我正在嘗試在存儲到csv
文件中的大型數據集上使用 ggplot2。 我曾經用 excel 閱讀它。
我不知道如何將此數據轉換為data.frame
。 特別是,我有一個日期列,其格式如下: "2020/04/12:12:00" 。 我怎樣才能讓R
理解這種格式?
如果是csv
,您可以使用:
fread
中data.table
。 這將是讀取 csv 的最快方法。readr
中的read_csv
或read_csv2
(用於;
分隔的文檔) 如果是.xls
(或.xlsx
)文檔,請查看readxl
package。
所有這些函數都將您的數據導入為data.frame
(附加類,如data.table
用於fread
或tibble
用於read_csv
)。
鑒於您的評論,您的文件似乎不是 excel 而是 csv。 如果要將列類型轉換為日期,假設您的 dataframe 稱為df
df[, dates := as.POSIXct(get(colnames(df)[1]), format = "%Y/%m/%d:%H:%M")]
請注意,您不需要使用cbind
甚至重新分配data.table
因為您使用:=
運算符
正如消息所說,您不需要POSIXlt
的額外精度
僅就這個問題而言,我建議使用 openxlsx package,它幫助我顯着減少了讀取大型數據集的時間。 根據您的問題和評論,您可能會發現這三點很有幫助
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.