繁体   English   中英

过滤,分组并计算熊猫?

[英]Filter , group by and count in pandas?

TSV文件包含一些用户事件数据:

user_uid category event_type
"11"      "like"   "post"
"33"      "share"  "status"
"11"      "like"   "post"
"42"      "share"  "post"

获取每个类别和每个user_id的post事件数量的最佳方法是什么?

我们应该显示以下输出:

user_uid category count
"11"     "like"    2
"42"     "share"   1

清理任何尾随空格,以便正确分组。 过滤您的DataFrame ,然后应用groupby + size

df['category'] = df.category.str.strip()
df['user_uid'] = df.user_uid.str.strip()
df[df.event_type == 'post'].groupby(['user_uid', 'category']).size()

输出:

user_uid  category
11        like        2
42        share       1
dtype: int64

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM