根据组（熊猫数据框）计算多列中的唯一值

Question

I have a dataframe in pandas: 我在熊猫中有一个数据框：

    a  b  c  d  e
0   1  x  y  t  u
1   1  x  z  y  v
2   1  y  x  t  z
3   2  x  t  z  u
4   2  z  x  y  t 
5   3  x  z  y  t

I need to transform this dataframe into this: 我需要将此数据框转换为此：

   a  x  y  z  t  u  v  y  z
0  1  3  3  2  2  1  1  3  2
1  2  2  1  2  2  1  0  1  2
2  3  1  1  1  1  0  0  0  0

Answer 1

IIUC IIUC

df.set_index('a').stack().groupby(level=0).value_counts().unstack(fill_value=0)
Out[514]: 
   t  u  v  x  y  z
a                  
1  2  1  1  3  3  2
2  2  1  0  2  1  2
3  1  0  0  1  1  1

Or using melt + crosstab 或使用melt + crosstab

s=df.melt('a')
pd.crosstab(s.a,s.value)
Out[518]: 
value  t  u  v  x  y  z
a                      
1      2  1  1  3  3  2
2      2  1  0  2  1  2
3      1  0  0  1  1  1

Answer 2

df.melt(id_vars="a").groupby(["a","value"]).count().unstack().fillna(0)

      variable                         
value        t    u    v    x    y    z
a                                      
1          2.0  1.0  1.0  3.0  3.0  2.0
2          2.0  1.0  0.0  2.0  1.0  2.0
3          1.0  0.0  0.0  1.0  1.0  1.0

根据组（熊猫数据框）计算多列中的唯一值

问题描述

2 个解决方案

解决方案1
3 已采纳 2018-06-06 01:24:39

解决方案2
1 2018-06-06 01:29:15

根据组（熊猫数据框）计算多列中的唯一值

问题描述

2 个解决方案

解决方案1 3 已采纳 2018-06-06 01:24:39

解决方案2 1 2018-06-06 01:29:15

解决方案1
3 已采纳 2018-06-06 01:24:39

解决方案2
1 2018-06-06 01:29:15