![](/img/trans.png)
[英]Chaining multiple data.table::merge operations with data.tables
[英]Merge 2 data.tables with more than one column the data.table way
我有兩個data.table
s 如下:-
a <- data.table(id = 1:10, val = 2010:2019)
b <- data.table(id = c(1, 2, 4, 6), year = 1:4)
現在,如果我將b
和a
合並如下:-
b[a, val := i.val, on = "id"]
這將在b
創建一個名為val
的額外列。 這也不會為b
data.table
重新分配內存。
我想知道,如果a
超過2列,是如下: -
a <- data.table(id = 1:10, val = 2010:2019,
twr = c(10, 13, 22 ,43, 23, 23, -4, 33, -54, 34))
如何合並兩個data.table
s( b
和a
), data.table
方式,即不使用merge
或任何join
函數。
但是使用[, , on = "id"]
語法。
我想知道這一點,因為使用任何join
函數或merge
都會創建一個全新的對象,而data.table
方式只創建新列而不是一個全新的對象。
提前致謝。
如果只有兩列要返回,只需on
通過 'id' 加入后用list
(或短格式.(
) 包裝,然后將:=
)這些列分配給 'b'
b[a, names(a)[-1] := .(i.val, i.twr), on = .(id)]
如果要返回的列很多
nm1 <- names(a)[-1]
b[a, (nm1) := mget(paste0("i.", nm1)), on = .(id)]
-輸出
b
id year val twr
1: 1 1 2010 10
2: 2 2 2011 13
3: 4 3 2013 43
4: 6 4 2015 23
在開發版本 1.14.1 中, data.table獲得了env
參數,用於在 data.table 上進行編程:
cols <- setdiff(names(a), "id")
b[a, on = "id", (cols) := acols, env = list(acols = as.list(cols))][]
id year val twr 1: 1 1 2010 10 2: 2 2 2011 13 3: 4 3 2013 43 4: 6 4 2015 23
這在許多情況下都有效,其中a
和b
除了要加入的列名之外沒有重復的列名。 但是,我們可以通過使用前綴i.
來顯式地引用a
的列i.
:
b[a, on = "id", (cols) := acols, env = list(acols = as.list(paste0("i.", cols)))][]
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.