繁体   English   中英

遍历数据框,使用 Pandas GroupBy.nunique 对列进行分组,并将分组的数据框列导出到多个.xlsx 文件

[英]Iterate through Data Frame, group columns with Pandas GroupBy.nunique, and export grouped Data Frame columns to multiple .xlsx files

我有一个包含超过 30 万条记录的 excel 文件,并且我正在尝试根据列类型“行政办公室”下列出的每条记录,将较小的数据子集 select 输出到单独的.xlsx 文件中。 有 10 种不同的办公室类型,我可以看到df.groupby('Executive Office').nunique()正确显示了这个计数。

我知道循环中有一些东西没有正确读取我的组的结果,但是我不太明白当它遍历数据框时发生了什么。

df = pd.read_excel(file.xlsx)
execGroups = df.groupby('Executive Office').nunique()

#for-loop intending to separate out employees by each individual executive group and export to .xlsx
for name, group in execGroups:
    df.to_excel('C:/filepath{}.xlsx'.format(name), index = False)
    print('Executive Group Files created')

我的错误是:

对于名称,execGroups 中的组:ValueError:要解包的值太多(预期为 2)

出现此错误是因为我没有为行政办公室类型定义列表或字典,和/或我没有正确理解密钥的使用吗?

错误是因为 execGroups 中只有一个变量。 您正在尝试获得两个:名称,组..

尝试这个:

for i in list(df['Executive Office'].unique()):
    tempdf=df.loc[df['Executive Office']=i]
    tempdf.to_excel('C:/filepath{}.xlsx'.format(i), index = False)

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM