熊貓 json_normalize KeyError

Question

我有一個沒有統一結構的嵌套 json 文件，如下例所示：

[{ "name": "Jon", "last": "Jonny"}, 
 {"name": "Jimmy", "last": "johnson", "kids":[{"kidName":"johnson_junior","kidAge": "1"}, {"kidName":"johnson_junior2", "kidAge": "4"}]}]

看到在第二項中有第一項中不存在的列表名稱“kids”。

當我嘗試用 pandas json_normalize 扁平化 json 時拋出錯誤消息：“KeyError：'kids'”

這是 json_normalize 命令：

flat_json = json_normalize(json_file, record_path= 'kids',  errors='ignore')

json_normalize 似乎不支持沒有統一結構的嵌套 json。

有人遇到過同樣的問題嗎？ 你知道如何度過難關嗎？

Answer 1

如果不是很麻煩，只要該鍵不存在，我就會添加'kids':[{'kidName':None,'kidAge':None}] 。

errors='ignore'用於meta中列出的鍵（請參閱docu ），而您對kids指定的是記錄路徑。

我不知道您是否在尋求一般性建議，如“如果記錄路徑密鑰有時不可用會發生什么？”，但以防萬一您提供的數據示例是您當前的問題，這就是我建議的快速修復.

這樣的事情有效：

data = {"name": "Jimmy", "last": "johnson", "kids":[{"kidName":"johnson_junior","kidAge": "1"}, {"kidName":"johnson_junior2", "kidAge": "4"}]}]

# then you inform with empty kids if looping doesn't alter your desired flow that much
[elem.update({'kids':[{'kidName':None,'kidAge':None}]}) for elem in data if 'kids' not in elem.keys()]

# finally you normalize
flat_json = json_normalize(data,'kids', ['name','last'])

輸出：

kidAge          kidName   name     last
0   None             None    Jon    Jonny
1      1   johnson_junior  Jimmy  johnson
2      4  johnson_junior2  Jimmy  johnson

熊貓 json_normalize KeyError

問題描述

1 個解決方案

解決方案1
3 2018-03-11 11:12:35

熊貓 json_normalize KeyError

問題描述

1 個解決方案

解決方案1 3 2018-03-11 11:12:35

解決方案1
3 2018-03-11 11:12:35