熊猫：获取给定列表的发生次数

Question

假设我有这样的事情

user_id,service
------------------
user_1,service1
user_2,service1
user_3,service2
user_1,service2
user_3,service1
user_3,service2

我最终想拥有的是：

user_id, service1, service2
----------------------------
user_1, 1, 1
user_2, 1, 0
user_3, 1, 2

到目前为止，这是我的代码：

data = pandas.read_csv('dataset.csv')

service_by_user = data['service'].groupby(data['user_id'])

count_occurences_services = service_by_user.apply(pandas.value_counts)

所以我得到的是我的代码：

user_1   service1    1
         service2    1
user_2   service1    1
         service2    0
user_3   service1    1
         service2    2

但是那时我不知道该怎么做。注意：我的用户和服务比本示例要多得多，并且并非所有用户都使用所有服务，实际上，在所有服务中最多使用3或4个用户。 我有一个数组，其中包含所有使用的服务：

service_by_user = data.set_index('user_id')
list_services = service_by_user.service.unique()

Answer 1

您可以使用pivot_table ：

data.pivot_table(index=['user_id'], columns=['service'], aggfunc='size', fill_value=0)

service  service1  service2
user_id                    
user_1          1         1
user_2          1         0
user_3          1         2

带有一些其他格式：

data.pivot_table(index=['user_id'], columns=['service'], aggfunc='size', fill_value=0) \
    .rename_axis(None, axis=1) \
    .reset_index()

  user_id  service1  service2
0  user_1         1         1
1  user_2         1         0
2  user_3         1         2

熊猫：获取给定列表的发生次数

问题描述

1 个解决方案

解决方案1
2 已采纳 2017-03-15 16:07:40

熊猫：获取给定列表的发生次数

问题描述

1 个解决方案

解决方案1 2 已采纳 2017-03-15 16:07:40

解决方案1
2 已采纳 2017-03-15 16:07:40