在列中為其他列中的每個唯一值查找唯一值的計數

Question

我有一個包含四列的數據框，track，num_tracks播放列表，cluster。 我的目標是創建一個新的數據框，該框架將輸出一行，其中包含集群中每個唯一值的軌道，pid和列及其相應的計數。

這是一個示例數據幀：

pid          track          cluster          num_track
0            1              6                4
0            2              1                4
0            3              6                4
0            4              3                4
1            5              10               3
1            6              10               3
1            7              1                4
2            8              9                5
2            9              11               5
2            10             2                5
2            11             2                5
2            12             2                5

所以我想要的輸出是：

pid track cluster num_track c1 c2 c3 c4 c5 c6 c7 ... c12
0   1     6       4         1  0  1  0  0  2  0      0
0   2     1       4         1  0  1  0  0  2  0      0
0   3     6       4         1  0  1  0  0  2  0      0
0   4     3       4         1  0  1  0  0  2  0      0
1   5     10      3         1  0  0  0  0  0  0      0
1   6     10      3         1  0  0  0  0  0  0      0
1   7     1       3         1  0  0  0  0  0  0      0
2   8     9       5         0  3  0  0  0  0  0      0
2   9     11      5         0  3  0  0  0  0  0      0
2   10    2       5         0  3  0  0  0  0  0      0
2   11    2       5         0  3  0  0  0  0  0      0
2   12    2       5         0  3  0  0  0  0  0      0

如果有什么不對的話，我希望我能正確地提出我的問題告訴我！ 我沒有足夠的代表來設置賞金，但是當我有足夠的時候可以重新發布。 任何幫助，將不勝感激！！

Answer 1

您可以使用帶有reindex crosstab ，然后concat回原始df

s=pd.crosstab(df.pid,df.cluster).reindex(df.pid)
s.index=df.index
df=pd.concat([df,s.add_prefix('c')],1)
df
Out[209]: 
    pid  track  cluster  num_track  c1  c2  c3  c6  c9  c10  c11
0     0      1        6          4   1   0   1   2   0    0    0
1     0      2        1          4   1   0   1   2   0    0    0
2     0      3        6          4   1   0   1   2   0    0    0
3     0      4        3          4   1   0   1   2   0    0    0
4     1      5       10          3   1   0   0   0   0    2    0
5     1      6       10          3   1   0   0   0   0    2    0
6     1      7        1          4   1   0   0   0   0    2    0
7     2      8        9          5   0   3   0   0   1    0    1
8     2      9       11          5   0   3   0   0   1    0    1
9     2     10        2          5   0   3   0   0   1    0    1
10    2     11        2          5   0   3   0   0   1    0    1
11    2     12        2          5   0   3   0   0   1    0    1

在列中為其他列中的每個唯一值查找唯一值的計數

問題描述

1 個解決方案

解決方案1
5 已采納 2019-03-04 18:10:22

在列中為其他列中的每個唯一值查找唯一值的計數

問題描述

1 個解決方案

解決方案1 5 已采納 2019-03-04 18:10:22

解決方案1
5 已采納 2019-03-04 18:10:22