[英]python: how to split excel files grouped by first column
我有一个表,需要将其拆分成多个文件,这些文件按列1的值分组-串行。
+--------+--------+-------+
| serial | name | price |
+--------+--------+-------+
| 100-a | rdl | 123 |
| 100-b | gm1 | -120 |
| 100-b | gm1 | 123 |
| 180r | xxom | 12 |
| 182d | data11 | 11.50 |
+--------+--------+-------+
输出将是这样的:
100-a.xls
100-b.xls
180r.xls etc.etc.
并打开100-b.xls包含以下内容:
+--------+------+-------+
| serial | name | price |
+--------+------+-------+
| 100-b | gm1 | -120 |
| 100-b | gm1 | 123 |
+--------+------+-------+
我尝试使用Pandas通过以下代码定义数据框:
import pandas as pd
#from itertools import groupby
df = pd.read_excel('myExcelFile.xlsx')
我成功地获取了数据帧,但是我不知道下一步该怎么做。 我尝试在Stackoverflow上关注此类似问题 ,但情况略有不同。 接下来的方法是什么?
这不是groupby,而是过滤器。
您需要遵循2个步骤:
这样的事情应该可以解决问题-
for x in list(df.serial.unique()) :
df[df.serial == x].to_excel("{}.xlsx".format(x))
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.