groupby 在熊貓的兩列中計算相同的值？

Question

我有以下熊貓數據框：

name1   name2
A       B
A       A
A       C
A       A
B       B
B       A

我想添加一個名為 new 的列，它計算name1 OR name2保留合並列（ name1和name2不同值）。 因此，預期的輸出是以下數據幀：

name   new
   A     7
   B     4
   C     1

我試過了

df.groupby(["name1"]).count().groupby(["name2"]).count()等等...但雖然最后一個似乎給了我正確的結果，但我不能獲取連接的數據集。

Answer 1

您可以將value_counts與df.stack() ：

df[['name1','name2']].stack().value_counts()
#df.stack().value_counts() for all cols

A    7
B    4
C    1

具體來說：

(df[['name1','name2']].stack().value_counts().
      to_frame('new').rename_axis('name').reset_index())

  name  new
0    A    7
1    B    4
2    C    1

Answer 2

讓我們嘗試melt

df.melt().value.value_counts()
Out[17]: 
A    7
B    4
C    1
Name: value, dtype: int64

Answer 3

或者，

df.name1.value_counts().add(df.name2.value_counts(), fill_value=0).astype(int)

給你

A    7
B    4
C    1
dtype: int64

Answer 4

使用Series.append和Series.value_counts ：

df['name1'].append(df['name2']).value_counts()

A    7
B    4
C    1
dtype: int64

value_counts將聚合列轉換為索引。 要獲得所需的輸出，請使用rename_axis和reset_index ：

df['name1'].append(df['name2']).value_counts().rename_axis('name').reset_index(name='new')

  name  new
0    A    7
1    B    4
2    C    1

Answer 5

python Counter是另一種解決方案

from collections import Counter

s = pd.Series(Counter(df.to_numpy().flatten()))

In [1325]: s
Out[1325]:
A    7
B    4
C    1
dtype: int64

groupby 在熊貓的兩列中計算相同的值？

問題描述

5 個解決方案

解決方案1
7 已采納 2019-12-31 16:34:32

解決方案2
4 2019-12-31 16:36:38

解決方案3
3 2019-12-31 16:37:24

解決方案4
3 2019-12-31 16:38:03

解決方案5
2 2019-12-31 16:49:36

groupby 在熊貓的兩列中計算相同的值？

問題描述

5 個解決方案

解決方案1 7 已采納 2019-12-31 16:34:32

解決方案2 4 2019-12-31 16:36:38

解決方案3 3 2019-12-31 16:37:24

解決方案4 3 2019-12-31 16:38:03

解決方案5 2 2019-12-31 16:49:36

解決方案1
7 已采納 2019-12-31 16:34:32

解決方案2
4 2019-12-31 16:36:38

解決方案3
3 2019-12-31 16:37:24

解決方案4
3 2019-12-31 16:38:03

解決方案5
2 2019-12-31 16:49:36