pandas.DataFrame.from_dict不使用OrderedDict保留顺序

Question

我想将荷兰统计局（CBS）的OData XML数据源导入我们的数据库。 使用lxml和pandas我认为这应该是直截了当的。 通过使用OrderDict，我想保留列的顺序以便于阅读，但不知怎的，我无法做到正确。

from collections import OrderedDict
from lxml import etree
import requests
import pandas as pd


# CBS URLs
base_url = 'http://opendata.cbs.nl/ODataFeed/odata'
datasets = ['/37296ned', '/82245NED']

feed = requests.get(base_url + datasets[1] + '/TypedDataSet')
root = etree.fromstring(feed.content)

# all record entries start at tag m:properties, parse into data dict
data = []
for record in root.iter('{{{}}}properties'.format(root.nsmap['m'])):
    row = OrderedDict()
    for element in record:
        row[element.tag.split('}')[1]] = element.text
    data.append(row)

df = pd.DataFrame.from_dict(data)
df.columns

检查data ，OrderDict的顺序正确。 但是看看df.head()这些列是否已经首先按字母顺序排序？

帮忙，有人吗？

Answer 1

您的示例中的某些内容似乎不一致，因为data是list而没有dict ，但假设您确实有一个OrderedDict ：

在创建DataFrame时尝试明确指定列顺序：

# ... all your data collection
df = pd.DataFrame(data, columns=data.keys())

这应该为您的DataFrame提供与OrderedDict中的列完全相同的列（通过data.keys()生成列表）

Answer 2

上面的答案对我不起作用并继续给我“ValueError：不能使用columns参数和orient ='columns'”。

后来我通过以下方式找到了解决方案并且工作：

df = pd.DataFrame.from_dict (dict_data) [list (dict_data[0].keys())]

pandas.DataFrame.from_dict不使用OrderedDict保留顺序

问题描述

2 个解决方案

解决方案1
28 已采纳 2015-11-17 14:02:27

解决方案2
0 2019-07-28 05:54:34

pandas.DataFrame.from_dict不使用OrderedDict保留顺序

问题描述

2 个解决方案

解决方案1 28 已采纳 2015-11-17 14:02:27

解决方案2 0 2019-07-28 05:54:34

解决方案1
28 已采纳 2015-11-17 14:02:27

解决方案2
0 2019-07-28 05:54:34