繁体   English   中英

熊猫分组依据汇总字符串字段

[英]Pandas group by to aggregate string field

我的df是这样的:

1   2   3
A  abc  ab
A  abc  cc
A  abc  ab

我想按记录分组

1   2   3
A  abc  ab
A  abc  cc

甚至更好的是,有一个带有串联字符串的字段:

   1  
A_abc_ab
A_abc_cc

Pandas GroupBy似乎不适用于字符串:

df = df.groupby(['1','2','3'])

返回

<pandas.core.groupby.DataFrameGroupBy object at 0x7f4a37549bd0>

您没有正确应用groupby 同样在groupby之后,您必须进行group.aggregate()以便基于某些功能减少单元格

可能您可能希望更好:

df.apply('-'.join, axis=1)

产生

0    A-abc-ab
1    A-abc-cc
2    A-abc-ab
dtype: object

当然,您可以在加入之前或之后drop_duplicates

从此移动:

1   2   3
A  abc  ab
A  abc  cc
A  abc  ab

对此:

1   2   3
A  abc  ab
A  abc  cc

根本不涉及分组! 您只是删除重复项:

In [9]: df.drop_duplicates()
Out[9]: 
   1    2   3
0  A  abc  ab
1  A  abc  cc

然后,您可以使用apply进行串联:

In [10]: df.drop_duplicates().apply('_'.join, axis=1)
Out[10]: 
0    A_abc_ab
1    A_abc_cc
dtype: object

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM