簡體   English   中英

R在不解壓縮的情況下讀取zip數據文件(信息丟失)

[英]R Reading in a zip data file without unzipping it (loss of information)

這個SO問題的答案之一中,我得到了以下內容:

require(readr)
myData <- read_csv("foo.txt.gz")

但這使我由於某種原因丟失了數據。

我的第二列是時間列,其格式為:9:30:00.244271971,此代碼將其轉換為:09:30:00,因此丟失了大量信息。

我怎樣才能解決這個問題? 有沒有辦法避免丟失此信息?

您也可以始終使用data.table fread() 您可以從file參數執行任意的shell命令來處理解壓縮,並且默認情況下,它也不會自動強制時間戳,因此您不應該遇到截斷問題。 fread的小插圖便捷功能有一些很好的例子。

(獎金,它比reader要快得多,如果您在github上安裝了帶有fread多線程的開發v1.10.5版本,它絕對會讓您大吃一驚。

library(data.table)

myData <- fread("gunzip -c foo.txt.gz")

@jaySf的評論原來效果很好。 所以這是答案:

(我有5列,其中前四列是字符,最后一列是數字。)

myData <- read_csv("foo.txt.gz", col_types = list("c","c","c","c","n"))

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM