如何按两列分组，然后计算每个分组在第三列中每个唯一值的出现次数？

Question

I have a unique identifier that I want to group by ["EMID"] along with a date column ["DateNew"].我有一个唯一标识符，我想按 ["EMID"] 以及日期列 ["DateNew"] 对其进行分组。 Then I would like to count the number of times each value in BRalpha occurs for each grouping.然后我想计算 BRalpha 中每个值在每个分组中出现的次数。

Data Set:数据集：

EMID EMID	DateNew日期新	BRalpha BRalpha
SIM10001 SIM10001	2016-06-01 2016-06-01	LUMB腰椎
SIM10001 SIM10001	2016-06-01 2016-06-01	LUMB腰椎
SIM10001 SIM10001	2016-07-01 2016-07-01	LUMB腰椎
SIM10001 SIM10001	2016-07-01 2016-07-01	THOR雷神
SIM10002 SIM10002	2016-02-01 2016-02-01	NSPC NSPC
SIM10002 SIM10002	2016-02-01 2016-02-01	NSPC NSPC
SIM10002 SIM10002	2016-02-01 2016-02-01	NSPC NSPC
SIM10002 SIM10002	2016-02-01 2016-02-01	NSPC NSPC
SIM10002 SIM10002	2016-02-01 2016-02-01	NSPC NSPC
SIM10003 SIM10003	2017-03-01 2017-03-01	ANFT ANFT
SIM10003 SIM10003	2017-03-01 2017-03-01	ANFT ANFT

Desired output:所需的 output：

EMID EMID	DateNew日期新	Count_LUMB计数_LUMB	Count_THOR Count_THOR	Count_NSPC Count_NSPC	Count_ANFT Count_ANFT
SIM10001 SIM10001	2016-06-01 2016-06-01	2 2	0 0	0 0	0 0
SIM10001 SIM10001	2016-07-01 2016-07-01	1 1	1 1	0 0	0 0
SIM10002 SIM10002	2016-02-01 2016-02-01	0 0	0 0	5 5	0 0
SIM10003 SIM10003	2017-03-01 2017-03-01	0 0	0 0	0 0	2 2

Answer 1

print(
    df.groupby(["EMID", "DateNew", "BRalpha"])
    .size()
    .unstack()
    .fillna(0)
    .astype(int)
    .add_prefix("count_")
    .reset_index()
)

Prints:印刷：

BRalpha      EMID     DateNew  count_ANFT  count_LUMB  count_NSPC  count_THOR
0        SIM10001  2016-06-01           0           2           0           0
1        SIM10001  2016-07-01           0           1           0           1
2        SIM10002  2016-02-01           0           0           5           0
3        SIM10003  2017-03-01           2           0           0           0

如何按两列分组，然后计算每个分组在第三列中每个唯一值的出现次数？

问题描述

1 个解决方案

解决方案1
0 2021-03-17 01:42:08

如何按两列分组，然后计算每个分组在第三列中每个唯一值的出现次数？

问题描述

1 个解决方案

解决方案1 0 2021-03-17 01:42:08

解决方案1
0 2021-03-17 01:42:08