標簽[rbindlist] - 堆棧內存溢出

[英]How to define the first column before import and bind ( rbindlist ) in R

目標導入並綁定 xlsx 文件列表，其中包含不可預測的不相關的第一列。（必須消除它，但您不知道哪個文件包含不相關的第一列。）不能簡單地使用，grepl("random_irrevelevant_value".x) 因為 "random_irrevelevant_value" 是一個隨機值。我 ...

如何重新綁定不同列大小和不同名稱的重塑數據表

[英]How to rbind reshaped data tables of different column sizes and with different names

我在 SO 中檢查了類似的條目，沒有一個能准確回答我的問題。我的問題是這樣的：假設用戶 1 有 6 次購買，用戶 2 有 2 次。購買數據是這樣的：所需的最終數據包括每個用戶的 1 行，其中保留用戶名、地址等。然后是 20 次購買的下一列。采購數據需要在同一行中依次放置。這是規則：每個用戶只 ...

rbindlist只有符合條件的元素

[英]rbindlist only elements that meet a condition

我有一個很大的清單。一些元素是字符串，一些元素是data.tables。我想創建一個大的data.table，但只是rbind是data.tables的元素。我知道如何在for循環中做到這一點，但我正在尋找更高效的東西，因為我的數據很大而且我需要快速的東西。謝謝！ li ...

使用rbindlist時遇到錯誤：結果的第25列被確定為integer64但是maxType =='Character'！= REALSXP

[英]Error encountered with using rbindlist: column 25 of result is determined to be integer64 but maxType == 'Character' !=REALSXP

我使用以下函數將目錄中的所有.csv文件合並為一個數據幀：此代碼產生此錯誤： rbindlist中的錯誤（lapply（filenames，fread），fill = TRUE）：內部錯誤：結果的第25列被確定為integer64但是maxType =='character' ...

使 rbindlist 跳過、忽略或更改列的類屬性

[英]Make rbindlist skip, ignore or change class attribute of the column

我想合並一大組數據框（大約 30 個），每個數據框有大約 200 個變量。這些數據集非常相似但不完全相同。請在下面找到兩個示例數據框：要重新創建錯誤：當我執行以下操作時數據集給出了錯誤：我可以做什么：使rbindlist跳過不匹配的列並添加一些后綴。將其中 ...

rbindlist-如何獲取帶有源信息的附加列？

[英]rbindlist - how to get an additional column with info about a source?

我在一個文件夾中存儲了30多個大型.csv文件。我想以下列條件將它們作為一個data.frame / data / table讀入R中：（1）應跳過每個文件的前25行和后25行（每個文件的行數不同）（2）最后一列應包含有關行源的唯一信息（例如，原始文件中的filename.c ...

列表中的數據清理后，綁定列表中的數據幀

[英]Binding dataframes in list after data cleaning on list

這是我最后一個問題（在對列表進行一些數據清理之后重新綁定較大的數據幀列表）的后續操作。我變得更聰明了，以前的問題變得一團糟。我有43個xlsx文件，這些文件已加載到R中的列表中：然后，我添加了一些列名：然后我刪除了一些列：我確實不需要刪除它們，但是當 ...

合並來自多個data.tables的唯一行並添加屬性詳細信息

[英]Combine unique rows from multiple data.tables and add attribute details

我有兩個這種格式的data.tables（實際的表每個都有大約一百萬行）：我想將兩者結合在一起，並根據所有列條目的唯一性僅保留唯一的行。這就是我所擁有的，但是我認為有更好的方法可以做到：一旦有了這個單一數據集，我想給任何重復的“代碼”記錄一些屬性信息（版本號和注釋，說明該 ...

展開包含的多列data.table<list> 觀察

[英]Expand multiple columns of data.table containing <list> observations

我有一個data.table ，其中超過 2 列屬於list類型。我想擴展這些列，以便列表的每個元素都成為一個新列。我想要一種比“手動”擴展每一列然后將表連接在一起更優雅的方式。設置編輯：（提供我從中獲得data.table的json ）所以我有一個這樣的json文件：我讀到的內 ...

如何從data.tables列表中計算每組的平均值？

[英]How to calculate mean per group from list of data.tables?

假設我們有一個data.table的列表，像這樣：如果我想要一個可以計算所有data.tables中每組平均值的解決方案，則可以執行以下操作：但是，根據我的數據，每個dt都非常大（數百萬行），每個列表也相當大（每個列表中500-1000 dt ）。也有大大超過兩個選項為b ...

rbindlist data.frames的列表列並選擇唯一值

[英]rbindlist a list column of data.frames and select unique values

我有一個data.table'DT'，其中一列（'col2'）是一個數據幀列表： col2中的每個data.frame都有兩列colA和colB。我想有一個data.table輸出，它根據DT的col1綁定那些data.frames的每個唯一行。我想這就像在rbindlist的聚 ...

相當於rbindlist？

[英]Spatial equivalent of rbindlist?

我需要循環查找SpatialPolygonDataFrames的負載。這些是通過緩沖道路文件創建的。但是，由於我的SpatialLinesDataFrame類的“ roads”文件長為15000行，因此rbind函數變得越來越慢。如果它們是數據幀，我將使用rblindlist加快速度 ...

由於字符串到日期的循環轉換而導致Rbindlist錯誤

[英]Rbindlist error due to string to date conversion in a loop

我正在構建一個復雜的代碼，該代碼循環10-1000個文件，並基於6個分組列為每個文件計算一大堆摘要統計信息。一切正常，但是在雙重應用結構中，我還嘗試從文件名中提取日期，並將其轉換為日期格式，並將其作為列添加到每個數據框。如果沒有完整代碼中的日期轉換以及本示例代碼中的日期轉換，它就可以 ...

導入由新行分隔的文本文件

[英]Import text file separated by new line

最終，我需要創建下表：等等。。。我在許多txt文件中獲取了我的數據，其中ID是文件的名稱。年齡和性別由新行分隔，例如：現在，我將所有文件合並到一個數據表中，文件路徑作為ID列（稍后我將用stringr刪除整個路徑）這是我的問題 - 我得到下表： ...

有效地連接一長串大型矩陣

[英]Concatenate long list of big matrices efficiently

我有一個4 Gb csv文件要加載到我的16 Gb計算機中， fread和read.csv無法一次加載它，它們返回內存錯誤。所以我決定按塊讀取文件，並且工作了（ data.frames一小時后），並且我得到了一個data.frames列表，如果我信任RStudio的Environment ...

為什么 rbindlist 比 rbind “更好”？

[英]Why is rbindlist "better" than rbind?

我正在瀏覽data.table的文檔，並且還從這里關於 SO 的一些對話中注意到rbindlist應該比rbind更好。我想知道為什么rbindlist比rbind更好，在哪些情況下rbindlist真的優於rbind ？在內存利用率方面有什么優勢嗎？ ...