熊貓：在分組之前先排序

Question

我有以下熊貓數據框：

A        B         C
A        A         Test1
A        A         Test2
A        A         XYZ
A        B         BA
A        B         AB
B        A         AA

我想對該數據集進行兩次分組：首先通過A和B將組連接到C中，然后僅在A上獲得僅由A列定義的組。結果如下所示：

A        A        Test1,Test2,XYZ
A        B        AB, BA
B        A        AA

最終結果應該是：

A        A,A:(Test1,Test2,XYZ), A,B:(AB, BA)
B        B,A:(AA)

串聯本身可以工作，但是排序似乎不起作用。

誰能幫助我解決這個問題？

親切的問候。

Answer 1

使用groupby + join

s1=df.groupby(['A','B']).C.apply(','.join)

s1
Out[421]: 
A  B
A  A    Test1,Test2,XYZ
   B              BA,AB
B  A                 AA
Name: C, dtype: object

s1.reset_index().groupby('A').apply(lambda x : x.set_index(['A','B'])['C'].to_dict())
Out[420]: 
A
A    {('A', 'A'): 'Test1,Test2,XYZ', ('A', 'B'): 'B...
B                                   {('B', 'A'): 'AA'}
dtype: object

Answer 2

第一sort_values由3列，然后groupby與join第一，然后再加入A用B列和最后groupby對於dictionary每基團：

df1 = df.sort_values(['A','B','C']).groupby(['A','B'])['C'].apply(','.join).reset_index()
#if only 3 columns DataFrame
#df1 = df.sort_values().groupby(['A','B'])['C'].apply(','.join).reset_index()
df1['D'] = df1['A'] + ',' + df1['B']
print (df1)
   A  B                C    D
0  A  A  Test1,Test2,XYZ  A,A
1  A  B            AB,BA  A,B
2  B  A               AA  B,A

s = df1.groupby('A').apply(lambda x: dict(zip(x['D'], x['C']))).reset_index(name='val')
print (s)
   A                                         val
0  A  {'A,A': 'Test1,Test2,XYZ', 'A,B': 'AB,BA'}
1  B                               {'B,A': 'AA'}

如果需要元組，只需更改代碼的第一部分：

df1 = df.sort_values(['A','B','C']).groupby(['A','B'])['C'].apply(tuple).reset_index()
df1['D'] = df1['A'] + ',' + df1['B']
print (df1)
   A  B                    C    D
0  A  A  (Test1, Test2, XYZ)  A,A
1  A  B             (AB, BA)  A,B
2  B  A                (AA,)  B,A

s = df1.groupby('A').apply(lambda x: dict(zip(x['D'], x['C']))).reset_index(name='val')
print (s)
   A                                                val
0  A  {'A,A': ('Test1', 'Test2', 'XYZ'), 'A,B': ('AB...
1  B                                   {'B,A': ('AA',)}

熊貓：在分組之前先排序

問題描述

2 個解決方案

解決方案1
3 2018-08-09 15:42:40

解決方案2
1 2018-08-09 15:46:30

熊貓：在分組之前先排序

問題描述

2 個解決方案

解決方案1 3 2018-08-09 15:42:40

解決方案2 1 2018-08-09 15:46:30

解決方案1
3 2018-08-09 15:42:40

解決方案2
1 2018-08-09 15:46:30