Python熊猫统计每列中的出现次数

Question

我是熊猫新手。 有人可以帮助我计算每一列的值频率吗？

数据帧：

id|flag1|flag2|flag3|  
---------------------
1 |  1  |   2 |   1 |  
2 |  3  |   1 |   1 |  
3 |  3  |   4 |   4 |  
4 |  4  |   1 |   4 |  
5 |  2  |   3 |   2 |

我想要类似的东西

id|flag1|flag2|flag3|  
---------------------
1 |  1  |   2 |   2 |  
2 |  1  |   1 |   1 |  
3 |  2  |   1 |   0 |  
4 |  1  |   1 |   2 |

说明-id 1在flag1中具有1个值，在flag2中具有2个值，在flag3中具有2个值。

Answer 1

首先通过filter或删除id列仅过滤flag列，然后apply函数value_counts ，最后将NaN替换为0并强制转换为int ：

df = df.filter(like='flag').apply(lambda x: x.value_counts()).fillna(0).astype(int)
print (df)
   flag1  flag2  flag3
1      1      2      2
2      1      1      1
3      2      1      0
4      1      1      2

要么：

df = df.drop('id', 1).apply(lambda x: x.value_counts()).fillna(0).astype(int)
print (df)
   flag1  flag2  flag3
1      1      2      2
2      1      1      1
3      2      1      0
4      1      1      2

谢谢巴拉斯的建议：

df = df.filter(like='flag').apply(pd.Series.value_counts()).fillna(0).astype(int)

Python熊猫统计每列中的出现次数

问题描述

1 个解决方案

解决方案1
2 已采纳 2017-11-20 11:06:51

Python熊猫统计每列中的出现次数

问题描述

1 个解决方案

解决方案1 2 已采纳 2017-11-20 11:06:51

解决方案1
2 已采纳 2017-11-20 11:06:51