Pandas groupby 多列獨占

Question

我有下面的 DataFrame 並且想找到每一列的y和n的計數：

ID	變種1	變量2
1個	是
2個	n	是
3個	是	n
4個	是	n
5個		是

結果會是這樣的：

	變種1_N	var2_N
是	3個	2個
n	1個	2個

我使用了transform function 但想知道是否有更好的方法來獲得結果。 謝謝！

Answer 1

您可以使用apply方法對需要計數的所有列執行value_counts ，結果將自動加入索引（或您的情況下的 var 值）：

df.filter(like='var').apply(lambda s: s.value_counts())

   var1  var2
y     3     2
n     1     2

或者直接使用pd.value_counts ：

df.filter(like='var').apply(pd.value_counts)

   var1  var2
y     3     2
n     1     2

Answer 2

您可以使用melt來展平您的unstack然后使用value_counts並拆開變量列：

>>> df.melt('ID').value_counts(['variable', 'value']).unstack('variable')

variable  var1  var2
value               
n            1     2
y            3     2

您可以刪除索引和列名：通過附加``

Output：

>>> df.melt('ID').value_counts(['variable', 'value']).unstack('variable') \
      .rename_axis(index=None, columns=None)

   var1  var2
n     1     2
y     3     2

Pandas groupby 多列獨占

問題描述

2 個解決方案

解決方案1
7 已采納 2022-02-16 19:23:27

解決方案2
1 2022-02-16 19:29:27

Pandas groupby 多列獨占

問題描述

2 個解決方案

解決方案1 7 已采納 2022-02-16 19:23:27

解決方案2 1 2022-02-16 19:29:27

解決方案1
7 已采納 2022-02-16 19:23:27

解決方案2
1 2022-02-16 19:29:27