“解包”熊猫数据框的最快方法

Question

希望标题不要误导。 我像往常一样在熊猫数据框中加载一个 Excel 文件

df = pd.read_excel('complete.xlsx')

这就是里面的东西（通常已经订购了 - 这是一个非常小的样本）

df
Out[21]: 
    Country       City First Name  Last Name  Ref
0   England     London       John      Smith   34
1   England     London       Bill       Owen  332
2   England   Brighton        Max      Crowe   25
3   England   Brighton      Steve      Grant   55
4    France      Paris     Roland      Tomas   44
5    France      Paris    Anatole     Donnet  534
6    France       Lyon     Paulin     Botrel  234
7     Spain     Madrid      Oriol  Abarquero   34
8     Spain     Madrid    Alberto    Olloqui  534
9     Spain  Barcelona      Ander     Moreno  254
10    Spain  Barcelona      Cesar     Aranda  222

我需要做的是自动导出数据，为每个国家/地区创建一个 sqlite 数据库（即“England.sqlite”），其中将包含每个城市（即伦敦和布莱顿）的表，并且每个表都将有相关人员信息。

sqlite 不是问题，我只是想弄清楚如何以最快速和“pythonic 的方式”“解压缩”数据帧

谢谢

Answer 1

您可以通过DataFrame.groupby对象循环：

for i, subdf in df.groupby('Country'):
     print (i)
     print (subdf)
     #processing

“解包”熊猫数据框的最快方法

问题描述

1 个解决方案

解决方案1
2 已采纳 2020-10-15 13:32:12

“解包”熊猫数据框的最快方法

问题描述

1 个解决方案

解决方案1 2 已采纳 2020-10-15 13:32:12

解决方案1
2 已采纳 2020-10-15 13:32:12