簡體   English   中英

ffbase :: as.character中的“ by”參數有什么作用?

[英]What does the “by” argument in ffbase::as.character do?

在下面的帖子中,

在R中使用ffdfdply函數進行聚合

有這樣一條線。

splitby <- as.character(data$Date, by = 250000)

只是出於好奇,我想知道by參數是指。 它似乎與ff數據幀有關,但我不確定。 Google搜索和as.characteras.vector R文檔沒有提供有用的信息。

我嘗試了一些示例,但是下面的代碼給出了相同的結果。

d <- seq.Date(Sys.Date(), Sys.Date()+10000, by = "day")
as.character(d, by=1)
as.character(d, by=10)
as.character(d, by=100)

如果有人能告訴我這是什么,我將不勝感激。 先感謝您。

由於as.character.ff在內部使用默認的as.character ,並且鑒於df向量可能大於RAM,因此需要對數據進行分塊處理。 chunk功能有助於將chunk划分為多個塊。 在這種情況下,相關方法是chunk.ff_vector 默認情況下,這將通過將getOption("ffbatchbytes")除以記錄大小來計算塊大小。 但是,可以通過使用by提供塊大小來覆蓋此行為。

在您給出的示例中,ff向量將一次轉換為250000個character成員。

最終的結果將是任何一樣by或不by的。 較大的值將導致更多地臨時使用RAM,但可能會更快地進行操作。

首先,該函數是ffbase::as.character ,而不是普通的舊base::as.character

請參閱http://www.inside-r.org/packages/cran/ffbase/docs/as.character.ff ,其中顯示

as.character((x, ...))

Arguments:
x: a ff vector
...: other parameters passed on to chunk

因此, by參數將傳遞給某些chunk函數。 然后,您需要確定正在使用哪個程序包的chunk功能。 輸入?chunk ,告訴我們哪個,然后閱讀其文檔以查看其by參數的作用。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM