熊猫如何按列中的特定值分组？

Question

我有一个包含多列的数据框，并为年龄间隔添加了新列。

# Create Age Intervals
bins = [0, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100]
df['age_intervals'] = pd.cut(df['age'],bins)

现在，我还有一个名为no_show列，该列使用值0或1来指定某个人是否出现在约会中。通过使用以下代码，我可以根据age_intervals数据。

df[['no_show','age_intervals']].groupby('age_intervals').count()

Output: 
age_intervals   no_show
  (0, 5]        8192
 (5, 10]        7017
(10, 15]        5719
(15, 20]        7379
(20, 25]        6750

但是如何将no_show数据基于其值0和1进行分组。例如，在年龄区间（0,5]中， no_show中的0和4901中的值为1，依此类推。

Answer 1

一种简单的方法是将两个列都分组，并使用size()返回一个Series：

df.groupby(['age_intervals', 'no_show']).size()

这将返回具有分别取决于age_intervals列和no_show列的值的系列。

熊猫如何按列中的特定值分组？

问题描述

1 个解决方案

解决方案1
2 已采纳 2018-09-11 05:04:29

熊猫如何按列中的特定值分组？

问题描述

1 个解决方案

解决方案1 2 已采纳 2018-09-11 05:04:29

解决方案1
2 已采纳 2018-09-11 05:04:29