![](/img/trans.png)
[英]full join error in R since switching from read.csv
我剛剛將 read.csv 換成了 vroom,從那以后我的 full_join 就無法正常工作了。 它拋出以下錯誤 [.data.table (y, x, nomatch = if (all.x) NA else NULL, on = by, : 邏輯錯誤。我不是 data.table,但提供了“ ...
[英]full join error in R since switching from read.csv
我剛剛將 read.csv 換成了 vroom,從那以后我的 full_join 就無法正常工作了。 它拋出以下錯誤 [.data.table (y, x, nomatch = if (all.x) NA else NULL, on = by, : 邏輯錯誤。我不是 data.table,但提供了“ ...
[英]vroom id argument - use filenames instead of archive name
我想用 vroom 讀取一個遠程存檔文件,並獲得一個帶有文件名而不是存檔名稱的附加列。 沒有本地 archive_extract 步驟的 vroom 是否可行,如下例所示? 謝謝library(tidyverse) library(archive) library(vroom) file < ...
[英]vroom_write writes negative zeros to file
我正在嘗試使用vroom::vroom_write將 tibble 寫入文本文件。 在我的 R 會話中,我看到我的 tibble 的第三列有一些零。 當我檢查文本文件時,我看到一些零被寫為負零。 這是重現我所看到的示例代碼。 這是我的 R dat中的數據。 這是文件out.txt。 這 ...
[英]Converting 7 or 8 digit numbers to dates in R
我正在將一個非常大的固定寬度數據集導入 R 並希望使用 vroom 以獲得更快的速度。 但是,此數據集中的日期采用 7 位或 8 位數字格式,具體取決於月份中的日期是 1 位還是 2 位(以下示例)。 我看不出有任何方法可以像通常那樣使用col_date(format = )來指定這種類型的格式。 ...
[英]Define decimal separator with vroom
我經常遇到 csv 文件,這些文件是用德語語言環境保存的,因此沒有正確用逗號分隔,而是用分號分隔。 這當然很容易通過定義分隔符來解決。 但是與例如fread相比, vroom不提供定義小數分隔符的可能性。 因此,帶有,作為小數點分隔符的數值被導入為字符或錯誤地沒有任何小數點分隔符,因此是非常大的數字 ...
[英]Performant implementation of function for converting data.frame to delimited string in R
我正在尋找一個快速序列化函數來將 data.frame 轉換為 R 中的分隔字符串。 目前我正在使用readr::format_tsv (版本readr_2.0.0 vroom_1.5.3 )進行轉換,我想知道是否有更快的實現可用。 對於下面的示例,轉換大約需要 4.4 秒,這對我來說太慢了。 系 ...
[英]Vroom/fread won't read LARGE .csv file - cannot memory map it
我有一個.csv文件,重量為 112GB,但vroom和data.table::fread都無法打開它。 即使我要求讀取 10 行或幾列,它也會抱怨映射錯誤:無法分配 memory。 另一方面, read.csv會愉快地讀取十行。 為什么vroom或fread不使用通常的 altrep 讀取它,即使 ...
[英]Partially read really large csv.gz in R using vroom
我有一個 csv.gz 文件(據我所知)壓縮前的大小為 70GB。 我的機器有 50GB 的 RAM,所以無論如何我永遠無法在 R 中打開它。 例如,我可以按如下方式加載前 10m 行: 對於我必須做的事情,可以一次加載 10m 行,執行我的操作,然后繼續接下來的 10m 行。 我可以循環執行 ...
[英]Using vroom to read in Date column and all other columns as double in R
我有包含超過 10000 個變量的 csv 文件。 我想使用 vroom 來讀取它們,並希望將第 1 列標識為日期,將第 2 列標識為字符,將第 3 和第 4 列標識為整數,並將所有其余列標識為雙精度。 我該怎么做呢? 我的代碼看起來像這樣,但失敗了。 告訴 vroom 將其余列讀取為 dou ...
[英]R: Reading specific columns from txt files with slightly different column headers (differing spaces) and binding them?
我有許多txt文件,它們在由; 分隔的列中包含相同類型的數值數據。 但是有些文件的列標題帶有空格,而有些則沒有(由不同的人創建)。 有些有我不想要的額外列。 例如,一個文件可能有 header,例如: 而另一個文件 header 可能是 在調用“讀取”命令之前,如何清除名稱中的空格? 清理標題腳本 ...