[英]R rbind while preserving order or rows in each data frame
我需要合並2個數據幀,同時在每個數據幀中保留它們的出現順序:
x = data.frame(a=1:3, b=2:4, c=3:5)
y = data.frame(a=c(10, 20, 30), b=c(20, 30, 40), c=c(30, 40, 50))
我想要的是:
> z
a b c
1 2 3
10 20 30
2 3 4
20 30 40
3 4 5
30 40 50
但是rbind做的是在第一個數據框下添加第二個數據幀。
試試這個單行
do.call("rbind", Map("rbind", split(x, 1:nrow(x)), split(y, 1:nrow(y))))
如果x
和y
在問題中如下,則給出此data.frame:
a b c
1.1 1 2 3
1.2 10 20 30
2.2 2 3 4
2.21 20 30 40
3.3 3 4 5
3.31 30 40 50
它逐行拆分每個數據,然后rbind拆分的相應組件。 然后它解決了所有這一切。 請注意,即使列具有不同類型,此單行也可以工作。 例如,即使:
x <- data.frame(a = letters[1:3], b = 1:3, c = c(TRUE, FALSE, TRUE))
y <- data.frame(a = LETTERS[1:3], b = 11:13, c = c(FALSE, TRUE, FALSE))
作為另一個基礎r版本:
x = data.frame(a=1:3, b=2:4, c=3:5)
y = data.frame(a=c(10, 20, 30), b=c(20, 30, 40), c=c(30, 40, 50))
mapply(FUN = function(i,j){rbind(i,j)}, x, y)
#> a b c
#> [1,] 1 2 3
#> [2,] 10 20 30
#> [3,] 2 3 4
#> [4,] 20 30 40
#> [5,] 3 4 5
#> [6,] 30 40 50
由reprex包創建於2019-02-14(v0.2.1)
您可以使用基礎R
Paweł的行號構思:
x$rowid <- seq(1, nrow(x)*2, by = 2) # or simply 1:nrow(x)
y$rowid <- seq(2, nrow(y)*2, by = 2)
z <- rbind(x, y)
z[order(z$rowid),]
a b c rowid
1 1 2 3 1
4 10 20 30 2
2 2 3 4 3
5 20 30 40 4
3 3 4 5 5
6 30 40 50 6
編輯也可以使用rbind()生成的rownames:
z <- do.call(rbind, list(x = x, x = y))
z[order(rownames(z)), ]
a b c
x.1 1 2 3
x.11 10 20 30
x.2 2 3 4
x.21 20 30 40
x.3 3 4 5
x.31 30 40 50
您應該在每個數據框中添加行號變量,並在綁定后按此變量進行排序。 使用dplyr
您可以執行以下操作:
library(dplyr)
x %>%
mutate(rn = row_number()) %>%
bind_rows(
y %>%
mutate(rn = row_number())
) %>%
arrange(rn)%>%
select(-4)
僅僅為了完整性,也是一個data.table
解決方案。
library(data.table)
dt.x <- data.table(x)
dt.y <- data.table(y)
dt.x[,Row.Num :=seq(1:.N)]
dt.y[,Row.Num :=seq(1:.N)]
rbindlist(list(dt.x,dt.y), idcol = TRUE)[order(Row.Num),]
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.