在pandas中分組數據幀？

Question

我對python pandas和使用數據幀很新。 可以說我的數據框如下所示：

我想找到數據框中有多少行在A和B列中具有相同的值，對於這些行，我想存儲C值。 因此，例如在此數據框中，我想存儲第1和第3個C值，因為每個行中的A和B具有相同的值。 基本上我想要一種打印類似的方法：“對於A = 3和B = 2，可能的C值是：3,1”並找到這些對。 我遵循官方的熊貓文檔，但我似乎無法找到這個。

Answer 1

不確定我是否遵循，但這可能會讓你去：

df = DataFrame({"a": [3,4,3,5], "b":[2,2,2,6], "c": [3,4,1,6]})
In [38]: for i, g in df.groupby(("a", "b")):
             print  i, g["c"].values
         ....:
(3, 2) [3 1]
(4, 2) [4]
(5, 6) [6]

Answer 2

你可以試試這個：

In [187]: df
Out[187]: 
   A  B  C
0  3  2  3
1  4  2  4
2  3  2  1
3  5  6  6

In [188]: df[df.groupby(['A', 'B']).transform(np.count_nonzero).C>=2]
Out[188]: 
   A  B  C
0  3  2  3
2  3  2  1
Name: C, dtype: float64

Answer 3

您可以使用unique SeriesGroupBy方法：

In [11]: df.groupby(["A", "B"])["C"].unique()
Out[11]:
A  B
3  2    [3, 1]
4  2       [4]
5  6       [6]
Name: C, dtype: object

另請參閱nunique以獲取唯一元素的數量。

在pandas中分組數據幀？

問題描述

3 個解決方案

解決方案1
2 已采納 2015-11-12 20:54:09

解決方案2
2 2015-11-12 22:53:21

解決方案3
2 2015-11-12 23:49:02

在pandas中分組數據幀？

問題描述

3 個解決方案

解決方案1 2 已采納 2015-11-12 20:54:09

解決方案2 2 2015-11-12 22:53:21

解決方案3 2 2015-11-12 23:49:02

解決方案1
2 已采納 2015-11-12 20:54:09

解決方案2
2 2015-11-12 22:53:21

解決方案3
2 2015-11-12 23:49:02