[英]Iterate through Data Frame, group columns with Pandas GroupBy.nunique, and export grouped Data Frame columns to multiple .xlsx files
我有一个包含超过 30 万条记录的 excel 文件,并且我正在尝试根据列类型“行政办公室”下列出的每条记录,将较小的数据子集 select 输出到单独的.xlsx 文件中。 有 10 种不同的办公室类型,我可以看到df.groupby('Executive Office').nunique()
正确显示了这个计数。
我知道循环中有一些东西没有正确读取我的组的结果,但是我不太明白当它遍历数据框时发生了什么。
df = pd.read_excel(file.xlsx)
execGroups = df.groupby('Executive Office').nunique()
#for-loop intending to separate out employees by each individual executive group and export to .xlsx
for name, group in execGroups:
df.to_excel('C:/filepath{}.xlsx'.format(name), index = False)
print('Executive Group Files created')
我的错误是:
对于名称,execGroups 中的组:ValueError:要解包的值太多(预期为 2)
出现此错误是因为我没有为行政办公室类型定义列表或字典,和/或我没有正确理解密钥的使用吗?
错误是因为 execGroups 中只有一个变量。 您正在尝试获得两个:名称,组..
尝试这个:
for i in list(df['Executive Office'].unique()):
tempdf=df.loc[df['Executive Office']=i]
tempdf.to_excel('C:/filepath{}.xlsx'.format(i), index = False)
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.