cost 79 ms
如何在 R 中定義導入和綁定 (rbindlist) 之前的第一列

[英]How to define the first column before import and bind ( rbindlist ) in R

目標導入並綁定 xlsx 文件列表,其中包含不可預測的不相關的第一列。 (必須消除它,但您不知道哪個文件包含不相關的第一列。) 不能簡單地使用,grepl("random_irrevelevant_value".x) 因為 "random_irrevelevant_value" 是一個隨機值。 我 ...

2019-10-07 03:48:27   1   28    r / rbindlist  
如何重新綁定不同列大小和不同名稱的重塑數據表

[英]How to rbind reshaped data tables of different column sizes and with different names

我在 SO 中檢查了類似的條目,沒有一個能准確回答我的問題。 我的問題是這樣的:假設用戶 1 有 6 次購買,用戶 2 有 2 次。購買數據是這樣的: 所需的最終數據包括每個用戶的 1 行,其中保留用戶名、地址等。然后是 20 次購買的下一列。 采購數據需要在同一行中依次放置。 這是規則:每個用戶只 ...

rbindlist只有符合條件的元素

[英]rbindlist only elements that meet a condition

我有一個很大的清單。 一些元素是字符串,一些元素是data.tables。 我想創建一個大的data.table,但只是rbind是data.tables的元素。 我知道如何在for循環中做到這一點,但我正在尋找更高效的東西,因為我的數據很大而且我需要快速的東西。 謝謝! li ...

使用rbindlist時遇到錯誤:結果的第25列被確定為integer64但是maxType =='Character'!= REALSXP

[英]Error encountered with using rbindlist: column 25 of result is determined to be integer64 but maxType == 'Character' !=REALSXP

我使用以下函數將目錄中的所有.csv文件合並為一個數據幀: 此代碼產生此錯誤: rbindlist中的錯誤(lapply(filenames,fread),fill = TRUE):內部錯誤:結果的第25列被確定為integer64但是maxType =='character' ...

使 rbindlist 跳過、忽略或更改列的類屬性

[英]Make rbindlist skip, ignore or change class attribute of the column

我想合並一大組數據框(大約 30 個),每個數據框有大約 200 個變量。 這些數據集非常相似但不完全相同。 請在下面找到兩個示例數據框: 要重新創建錯誤: 當我執行以下操作時 數據集給出了錯誤: 我可以做什么: 使rbindlist跳過不匹配的列並添加一些后綴。 將其中 ...

rbindlist-如何獲取帶有源信息的附加列?

[英]rbindlist - how to get an additional column with info about a source?

我在一個文件夾中存儲了30多個大型.csv文件。 我想以下列條件將它們作為一個data.frame / data / table讀入R中: (1)應跳過每個文件的前25行和后25行(每個文件的行數不同) (2)最后一列應包含有關行源的唯一信息(例如,原始文件中的filename.c ...

列表中的數據清理后,綁定列表中的數據幀

[英]Binding dataframes in list after data cleaning on list

這是我最后一個問題( 在對列表進行一些數據清理之后重新綁定較大的數據幀列表 )的后續操作。 我變得更聰明了,以前的問題變得一團糟。 我有43個xlsx文件,這些文件已加載到R中的列表中: 然后,我添加了一些列名: 然后我刪除了一些列: 我確實不需要刪除它們,但是當 ...

合並來自多個data.tables的唯一行並添加屬性詳細信息

[英]Combine unique rows from multiple data.tables and add attribute details

我有兩個這種格式的data.tables(實際的表每個都有大約一百萬行): 我想將兩者結合在一起,並根據所有列條目的唯一性僅保留唯一的行。 這就是我所擁有的,但是我認為有更好的方法可以做到: 一旦有了這個單一數據集,我想給任何重復的“代碼”記錄一些屬性信息(版本號和注釋,說明該 ...

展開包含的多列data.table<list> 觀察

[英]Expand multiple columns of data.table containing <list> observations

我有一個data.table ,其中超過 2 列屬於list類型。 我想擴展這些列,以便列表的每個元素都成為一個新列。 我想要一種比“手動”擴展每一列然后將表連接在一起更優雅的方式。 設置 編輯:(提供我從中獲得data.table的json ) 所以我有一個這樣的json文件: 我讀到的內 ...

如何從data.tables列表中計算每組的平均值?

[英]How to calculate mean per group from list of data.tables?

假設我們有一個data.table的列表,像這樣: 如果我想要一個可以計算所有data.tables中每組平均值的解決方案,則可以執行以下操作: 但是,根據我的數據,每個dt都非常大(數百萬行),每個列表也相當大(每個列表中500-1000 dt )。 也有大大超過兩個選項為b ...

rbindlist data.frames的列表列並選擇唯一值

[英]rbindlist a list column of data.frames and select unique values

我有一個data.table'DT',其中一列('col2')是一個數據幀列表: col2中的每個data.frame都有兩列colA和colB。 我想有一個data.table輸出,它根據DT的col1綁定那些data.frames的每個唯一行。 我想這就像在rbindlist的聚 ...

相當於rbindlist?

[英]Spatial equivalent of rbindlist?

我需要循環查找SpatialPolygonDataFrames的負載。 這些是通過緩沖道路文件創建的。 但是,由於我的SpatialLinesDataFrame類的“ roads”文件長為15000行,因此rbind函數變得越來越慢。 如果它們是數據幀,我將使用rblindlist加快速度 ...

由於字符串到日期的循環轉換而導致Rbindlist錯誤

[英]Rbindlist error due to string to date conversion in a loop

我正在構建一個復雜的代碼,該代碼循環10-1000個文件,並基於6個分組列為每個文件計算一大堆摘要統計信息。 一切正常,但是在雙重應用結構中,我還嘗試從文件名中提取日期,並將其轉換為日期格式,並將其作為列添加到每個數據框。 如果沒有完整代碼中的日期轉換以及本示例代碼中的日期轉換,它就可以 ...

導入由新行分隔的文本文件

[英]Import text file separated by new line

最終,我需要創建下表: 等等。 。 。 我在許多txt文件中獲取了我的數據,其中ID是文件的名稱。 年齡和性別由新行分隔,例如: 現在,我將所有文件合並到一個數據表中,文件路徑作為ID列(稍后我將用stringr刪除整個路徑) 這是我的問題 - 我得到下表: ...

有效地連接一長串大型矩陣

[英]Concatenate long list of big matrices efficiently

我有一個4 Gb csv文件要加載到我的16 Gb計算機中, fread和read.csv無法一次加載它,它們返回內存錯誤。 所以我決定按塊讀取文件,並且工作了( data.frames一小時后),並且我得到了一個data.frames列表,如果我信任RStudio的Environment ...

為什么 rbindlist 比 rbind “更好”?

[英]Why is rbindlist "better" than rbind?

我正在瀏覽data.table的文檔,並且還從這里關於 SO 的一些對話中注意到rbindlist應該比rbind更好。 我想知道為什么rbindlist比rbind更好,在哪些情況下rbindlist真的優於rbind ? 在內存利用率方面有什么優勢嗎? ...


 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM