[英]R: full_join of two datasets reports more rows than adding those of dataset 1 and dataset 2
我有兩個數據集。 我試圖加入這些數據集的變量具有以下維度:數據集 1 - 100 數據集 2 - 30
即使沒有任何交集,使用 full_joint 的最大行數也應該是 130,對吧?
加入數據集后,我得到的結果是130 多行,這怎么可能?
您的數據集中可能有重復的 id。 例子:
d1 <- data.frame(id = rep(1,5)) # 5 rows, 1 id
d2 <- data.frame(id = rep(1,5)) # 5 rows, 1 id
d1
d2
merge(d1, d2, by = "id", all = T) # 25 rows = 5 * 5
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.