[英]Count frequency of value in pandas column where values in another column are similar
給定一個pandas
dataframe
,其外觀如下column_a
和column_b
。 我該如何構造另外2列,一列為所有列計算column_a
中每個值的頻率,另一列為column_a
中的值相同的地方計算值的唯一數目:
column_a | column_b | col_a_count | count_unique_b_where_a
0 1 4 3
0 1 4 3
0 2 4 3
0 3 4 3
2 0 3 1
2 0 3 1
2 0 3 1
5 3 1 1
9 5 6 5
9 5 6 5
9 3 6 5
9 4 6 5
9 2 6 5
9 1 6 5
使用groupby
和agg
:
s = (df.groupby('column_a').agg(
{'column_a': 'count', 'column_b': 'nunique'}).reindex(df.column_a))
column_a column_b
column_a
0 4 3
0 4 3
0 4 3
0 4 3
2 3 1
2 3 1
2 3 1
5 1 1
9 6 5
9 6 5
9 6 5
9 6 5
9 6 5
9 6 5
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.