将 pandas dataframe 按两列分组而不汇总

Question

我在美国不同的州有一个 pandas Dataframe。 我想按年份和state这两列分组，以便统计测试一些事情，例如死因、新生儿等，还有 plot 它。 我只能提出groupby pandas function ，最后我必须指定一个统计摘要，例如：

import pandas as pd
df = pd.read_csv(path + 'csvfile.csv')
grouped_df = df.groupby(['Year', 'State']).mean()

但是，我只想按年份和state单独分组，但是使用groupby这样做我得到了：

import pandas as pd
df = pd.read_csv(path + 'csvfile.csv')
grouped_df = df.groupby(['Year', 'State'])

<pandas.core.groupby.generic.DataFrameGroupBy object at 0x0000025720134688>

我怎样才能做到这一点？

Answer 1

第一个groupby像iterator一样简化，所以指定之后的内容很重要 - 聚合 function，自定义 function..？

不确定group by the year and state alone是什么意思，如果需要按 2 列使用MultiIndex ，请使用：

grouped_df = df.set_index(['Year', 'State'])

将 pandas dataframe 按两列分组而不汇总

问题描述

1 个解决方案

解决方案1
1 已采纳 2021-12-01 08:31:45

将 pandas dataframe 按两列分组而不汇总

问题描述

1 个解决方案

解决方案1 1 已采纳 2021-12-01 08:31:45

解决方案1
1 已采纳 2021-12-01 08:31:45