Pandas groupby 多列独占

Question

I have the DataFrame below and want to find the count of y and n for each column:我有下面的 DataFrame 并且想找到每一列的y和n的计数：

ID ID	var1变种1	var2变量2
1 1个	y是
2 2个	n n	y是
3 3个	y是	n n
4 4个	y是	n n
5 5个		y是

the result would be like this:结果会是这样的：

	var1_N变种1_N	var2_N var2_N
y是	3 3个	2 2个
n n	1 1个	2 2个

I used transform function but was wondering there is a better way to get the results.我使用了transform function 但想知道是否有更好的方法来获得结果。 Thanks!谢谢！

Answer 1

You can just do value_counts on all columns you need to count using apply method, the results will be automatically joined on the index (or var value in your case):您可以使用apply方法对需要计数的所有列执行value_counts ，结果将自动加入索引（或您的情况下的 var 值）：

df.filter(like='var').apply(lambda s: s.value_counts())

   var1  var2
y     3     2
n     1     2

Or use pd.value_counts directly:或者直接使用pd.value_counts ：

df.filter(like='var').apply(pd.value_counts)

   var1  var2
y     3     2
n     1     2

Answer 2

You can use melt to flatten your dataframe then use value_counts and unstack the variable column:您可以使用melt来展平您的unstack然后使用value_counts并拆开变量列：

>>> df.melt('ID').value_counts(['variable', 'value']).unstack('variable')

variable  var1  var2
value               
n            1     2
y            3     2

You can remove index and column names: by appending ``您可以删除索引和列名：通过附加``

Output: Output：

>>> df.melt('ID').value_counts(['variable', 'value']).unstack('variable') \
      .rename_axis(index=None, columns=None)

   var1  var2
n     1     2
y     3     2

Pandas groupby 多列独占

问题描述

2 个解决方案

解决方案1
7 已采纳 2022-02-16 19:23:27

解决方案2
1 2022-02-16 19:29:27

Pandas groupby 多列独占

问题描述

2 个解决方案

解决方案1 7 已采纳 2022-02-16 19:23:27

解决方案2 1 2022-02-16 19:29:27

解决方案1
7 已采纳 2022-02-16 19:23:27

解决方案2
1 2022-02-16 19:29:27