[英]Combining csv files using pandas (merging and duplication)
我要完成的任务有点复杂,因此我将尽我所能尽力解释。
我有两个以下格式的简历文件:
CSV1:
Name Var2 Var3
John 6 7
John 7 8
Mike 5 6
CSV2:
Name Var4 Var5
John 8 8
John 9 9
Mike 1 1
Mike 2 2
我本质上想要做的是合并文件,但格式如下:
Name Var2 Var3 Var4 Var5
John 6 7 8 8
John 6 7 9 9
John 7 8 8 8
John 7 8 9 9
Mike 5 6 1 1
Mike 5 6 2 2
实际上,它会根据第二个csv中有多少个相同的名字条目来复制第一个csv中的每个Name条目,并添加第二个csv中的相应列
我可以检查csv1中的名称是否与csv 2中的名称匹配,但是从那以后我不确定如何继续
您可以使用pd.merge
In [19]: df1
Out[19]:
Name Var2 Var3
0 John 6 7
1 John 7 8
2 Mike 5 6
In [20]: df2
Out[20]:
Name Var4 Var5
0 John 8 8
1 John 9 9
2 Mike 1 1
3 Mike 2 2
In [21]: df1.merge(df2, how='right', on='Name')
Out[21]:
Name Var2 Var3 Var4 Var5
0 John 6 7 8 8
1 John 7 8 8 8
2 John 6 7 9 9
3 John 7 8 9 9
4 Mike 5 6 1 1
5 Mike 5 6 2 2
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.