[英]How to combine several similar .csv files into one dataframe with given structure
[英]How to combine several rows into one based on a similar key in pandas dataframe?
假设我有一个像这样的 dataframe:
第 1 列 | 第 2 列 | 第 3 栏 | 第 4 栏 | 第 5 栏 | 第 6 栏 | 第 7 栏 | 平台键 |
---|---|---|---|---|---|---|---|
亚马逊网络服务锯 | 亚太孟买 | 38.33 | 楠 | 楠 | 楠 | 楠 | amazonwebservicesaws_asiapacific孟买 |
亚马逊网络服务锯 | 亚太孟买 | 楠 | 楠 | 楠 | 楠 | 1.83 | amazonwebservicesaws_asiapacific孟买 |
亚马逊网络服务锯 | 亚太孟买 | 楠 | 楠 | 楠 | 5 | 楠 | amazonwebservicesaws_asiapacific孟买 |
亚马逊网络服务锯 | 亚太孟买 | 楠 | 楠 | 2.21 | 楠 | 楠 | amazonwebservicesaws_asiapacific孟买 |
亚马逊网络服务锯 | 亚太孟买 | 楠 | 20.83 | 楠 | 楠 | 楠 | amazonwebservicesaws_asiapacific孟买 |
我想根据平台键组合所有这些行(示例中有 5 个,但实际数据集中更多)和列(也比下面数据集中显示的更多)。 所以像这样:
第 1 列 | 第 2 列 | 第 3 栏 | 第 4 栏 | 第 5 栏 | 第 6 栏 | 第 7 栏 | 平台键 |
---|---|---|---|---|---|---|---|
亚马逊网络服务锯 | 亚太孟买 | 38.33 | 20.83 | 2.21 | 5 | 1.83 | amazonwebservicesaws_asiapacific孟买 |
做这个的最好方式是什么?
我们可以使用first
进行groupby
,这将选择第一个非NaN
值 per col
out = df.groupby(['Platform_key'],as_index=False).first()
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.