在與另一列Pandas中的唯一值相關聯的列中查找值的交集

Question

如果我有一個像這樣的DataFrame （非常簡單的例子）

  col1  col2
0    a     1
1    a     2
2    b     1
3    b     2
4    b     4
5    c     1
6    c     2
7    c     3

並且我想要所有col2值與其唯一的col1值相關的交集（因此，在這種情況下，交集為[1,2] ），我該如何使用Pandas？ 另一種方式來話，這將是在值col2存在於每一個獨特的價值col1 。

我的（ 不好的 ）解決方案是獲取具有unique的唯一col1元素，然后從col1每個唯一元素構建字典，然后獲取這些字典值的交集。 我覺得我應該使用一種機制將列關聯在一起，但是這可以使此過程變得容易得多。

Answer 1

一種方法是使用pivot_table ：

In [11]: cross = df.pivot_table(index="col1", columns="col2", aggfunc='size') == 1

In [12]: cross
Out[12]:
col2     1     2      3      4
col1
a     True  True  False  False
b     True  True  False   True
c     True  True   True  False

In [13]: cross.all()
Out[13]:
col2
1     True
2     True
3    False
4    False
dtype: bool

In [14]: cross.columns[cross.all()]
Out[14]: Int64Index([1, 2], dtype='int64', name='col2')

Answer 2

另一個解決方案：

print df.pivot_table(index="col1", columns="col2", aggfunc=len)
col2    1    2    3    4
col1                    
a     1.0  1.0  NaN  NaN
b     1.0  1.0  NaN  1.0
c     1.0  1.0  1.0  NaN

ser = (df.pivot_table(index="col1", columns="col2", aggfunc=len) == 1).all()
print  ser.index[ser]
Int64Index([1, 2], dtype='int64', name=u'col2')

在與另一列Pandas中的唯一值相關聯的列中查找值的交集

問題描述

2 個解決方案

解決方案1
2 已采納 2016-05-13 07:04:31

解決方案2
1 2016-05-13 07:08:25

在與另一列Pandas中的唯一值相關聯的列中查找值的交集

問題描述

2 個解決方案

解決方案1 2 已采納 2016-05-13 07:04:31

解決方案2 1 2016-05-13 07:08:25

解決方案1
2 已采納 2016-05-13 07:04:31

解決方案2
1 2016-05-13 07:08:25