[英]Fastest way to "unpack' a pandas dataframe
希望标题不要误导。 我像往常一样在熊猫数据框中加载一个 Excel 文件
df = pd.read_excel('complete.xlsx')
这就是里面的东西(通常已经订购了 - 这是一个非常小的样本)
df
Out[21]:
Country City First Name Last Name Ref
0 England London John Smith 34
1 England London Bill Owen 332
2 England Brighton Max Crowe 25
3 England Brighton Steve Grant 55
4 France Paris Roland Tomas 44
5 France Paris Anatole Donnet 534
6 France Lyon Paulin Botrel 234
7 Spain Madrid Oriol Abarquero 34
8 Spain Madrid Alberto Olloqui 534
9 Spain Barcelona Ander Moreno 254
10 Spain Barcelona Cesar Aranda 222
我需要做的是自动导出数据,为每个国家/地区创建一个 sqlite 数据库(即“England.sqlite”),其中将包含每个城市(即伦敦和布莱顿)的表,并且每个表都将有相关人员信息。
sqlite 不是问题,我只是想弄清楚如何以最快速和“pythonic 的方式”“解压缩”数据帧
谢谢
您可以通过DataFrame.groupby
对象循环:
for i, subdf in df.groupby('Country'):
print (i)
print (subdf)
#processing
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.