[英]Trying to combine/merge two data frames in R, matching values in two columns and returning a third
我正在尝试在R中组合两个数据帧,使用我认为相当于Excel的VLOOKUP函数。
在一个数据框中,我有一个曲棍球比赛中发生的事件列表(每个游戏由不同的赛季和“gcode”代表) - 每场比赛有数百行。
我想添加一个列,告诉我团队是赢还是输。 我将结果放在不同的数据框中(结果列表,每个游戏一行)。
如何使用“merge()”或类似功能来执行此操作? 我需要在每个数据框中引用“季节”和“gcode”的功能。
这是两个示例数据框,以及我想要的结果。
事件清单:
season gcode seconds score_dif
1 20072008 20001 145 2
2 20072008 20001 2055 1
3 20072008 20002 691 0
4 20082009 20053 3528 -1
5 20092010 20104 2787 1
6 20092010 20155 1752 1
7 20102011 20206 2929 0
8 20102011 20257 277 3
9 20102011 20308 2733 -2
10 20132014 20359 3890 -4
结果列表:
season gcode result
1 20072008 20001 1
2 20072008 20002 0
3 20072008 20003 1
4 20072008 20004 0
5 20072008 20005 0
6 20072008 20006 0
7 20072008 20007 0
8 20072008 20008 1
9 20072008 20009 0
10 20072008 20010 1
联合:
season gcode seconds score_dif result
1 20072008 20001 145 2 1
2 20072008 20001 2055 1 1
3 20072008 20002 691 0 0
4 20082009 20053 3528 -1 0
5 20092010 20104 2787 1 1
6 20092010 20155 1752 1 0
7 20102011 20206 2929 0 0
8 20102011 20257 277 3 0
9 20102011 20308 2733 -2 0
10 20132014 20359 3890 -4 1
谢谢!
使用dplyr
包
library(dplyr)
df <- events %>%
left_join(results)
如果它无法正常工作,您可以在两个data.frames
创建一个新的列join
:
events$join <- paste0(events$season,events$gcode)
results$join <- ...
接着
df <- events %>%
left_join(results, by = "join")
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.