繁体   English   中英

“解包”熊猫数据框的最快方法

[英]Fastest way to "unpack' a pandas dataframe

希望标题不要误导。 我像往常一样在熊猫数据框中加载一个 Excel 文件

df = pd.read_excel('complete.xlsx')

这就是里面的东西(通常已经订购了 - 这是一个非常小的样本)

df
Out[21]: 
    Country       City First Name  Last Name  Ref
0   England     London       John      Smith   34
1   England     London       Bill       Owen  332
2   England   Brighton        Max      Crowe   25
3   England   Brighton      Steve      Grant   55
4    France      Paris     Roland      Tomas   44
5    France      Paris    Anatole     Donnet  534
6    France       Lyon     Paulin     Botrel  234
7     Spain     Madrid      Oriol  Abarquero   34
8     Spain     Madrid    Alberto    Olloqui  534
9     Spain  Barcelona      Ander     Moreno  254
10    Spain  Barcelona      Cesar     Aranda  222

我需要做的是自动导出数据,为每个国家/地区创建一个 sqlite 数据库(即“England.sqlite”),其中将包含每个城市(即伦敦和布莱顿)的表,并且每个表都将有相关人员信息。

sqlite 不是问题,我只是想弄清楚如何以最快速和“pythonic 的方式”“解压缩”数据帧

谢谢

您可以通过DataFrame.groupby对象循环:

for i, subdf in df.groupby('Country'):
     print (i)
     print (subdf)
     #processing

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM