遍历数据框，使用 Pandas GroupBy.nunique 对列进行分组，并将分组的数据框列导出到多个.xlsx 文件

Question

我有一个包含超过 30 万条记录的 excel 文件，并且我正在尝试根据列类型“行政办公室”下列出的每条记录，将较小的数据子集 select 输出到单独的.xlsx 文件中。 有 10 种不同的办公室类型，我可以看到df.groupby('Executive Office').nunique()正确显示了这个计数。

我知道循环中有一些东西没有正确读取我的组的结果，但是我不太明白当它遍历数据框时发生了什么。

df = pd.read_excel(file.xlsx)
execGroups = df.groupby('Executive Office').nunique()

#for-loop intending to separate out employees by each individual executive group and export to .xlsx
for name, group in execGroups:
    df.to_excel('C:/filepath{}.xlsx'.format(name), index = False)
    print('Executive Group Files created')

我的错误是：

对于名称，execGroups 中的组：ValueError：要解包的值太多（预期为 2）

出现此错误是因为我没有为行政办公室类型定义列表或字典，和/或我没有正确理解密钥的使用吗？

Answer 1

错误是因为 execGroups 中只有一个变量。 您正在尝试获得两个：名称，组..

尝试这个：

for i in list(df['Executive Office'].unique()):
    tempdf=df.loc[df['Executive Office']=i]
    tempdf.to_excel('C:/filepath{}.xlsx'.format(i), index = False)

遍历数据框，使用 Pandas GroupBy.nunique 对列进行分组，并将分组的数据框列导出到多个.xlsx 文件

问题描述

1 个解决方案

解决方案1
2 已采纳 2021-01-11 23:36:22

遍历数据框，使用 Pandas GroupBy.nunique 对列进行分组，并将分组的数据框列导出到多个.xlsx 文件

问题描述

1 个解决方案

解决方案1 2 已采纳 2021-01-11 23:36:22

解决方案1
2 已采纳 2021-01-11 23:36:22