![](/img/trans.png)
[英]Applying a function iteratively in a grouped dplyr dataframe to create a column in R
[英]Add column to grouped dataframe dplyr
我有兩個不同的數據框
DF1 = data.frame("A"= c("a","a","b","b","c","c"), "B"= c(1,2,3,4,5,6))
DF2 = data.frame("A"=c("a","b","c"), "C"=c(10,11,12))
我想將C
列添加到按A
列分組的DF1
預期的結果是
A B C
1 a 1 10
2 a 2 10
3 b 3 11
4 b 4 11
5 c 5 12
6 c 6 12
注意:在此示例中,所有組的大小都相同,但不一定是這種情況
歡迎使用 stackoverflow。 正如@KarthikS 評論的那樣,您想要的是加入。
“Joining”是將兩個表連接在一起的操作名稱。 “分組依據”列主要用於匯總表格時:例如,按州分組和總票數將給出每個州的總票數(不先分組的總和將給出總票數)。
dplyr 中連接的語法是:
output = left_join(df1, df2, by = "shared column")
或等效地
output = df1 %>% left_join(df2, by = "shared column")
重點參考這里。
在您的示例中,共享列是"A"
。
我們可以使用來自base R
merge
merge(DF1, DF2, by = 'A', all.x = TRUE)
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.