簡體   English   中英

將JSON網站轉換為Python中的字典

[英]Converting a json website into a dictionary in python

我正在嘗試編寫一個函數,以便從下面的網站中以python的形式從字典中獲取數據,如果有人可以向我指出正確的方向,我似乎找不到任何方法可以在任何地方進行操作大。

http://openexchangerates.org/api/currencies.json

到目前為止,我的情況是這樣,但是我不斷收到一條錯誤消息:“ JSON對象必須是str,而不是字節”

import urllib, json
url = 'http://openexchangerates.org/api/currencies.json'
response = urllib.request.urlopen(url);
data = json.loads(response.read())
print(data)

您需要將JSON數據解碼為字符串:

import urllib.request
import json

url = 'http://openexchangerates.org/api/currencies.json'
response = urllib.request.urlopen(url)
encoding = response.info().get_content_charset('utf8')
data = json.loads(response.read().decode(encoding))

這將使用HTTP服務器指定的正確編解碼器;如果未指定,則使用UTF-8。 UTF-8是JSON數據的默認編解碼器。

在這種情況下,服務器已將字符集顯式設置為UTF-8:

>>> import urllib.request
>>> import json
>>> url = 'http://openexchangerates.org/api/currencies.json'
>>> response = urllib.request.urlopen(url)
>>> response.info().get('content-type')
'application/json; charset=utf-8'
>>> response.info().get_content_charset()
'utf-8'

因此,使用該編解碼器進行解碼即可為json.loads()產生預期的輸入:

>>> encoding = response.info().get_content_charset('utf8')
>>> data = json.loads(response.read().decode(encoding))
>>> data.keys()
dict_keys(['BYR', 'VUV', 'TTD', 'PHP', 'CRC', 'KWD', 'BGN', 'XDR', 'PGK', 'STD', 'MZN', 'XCD', 'ANG', 'MTL', 'AZN', 'LTL', 'MXN', 'TJS', 'CVE', 'DZD', 'MYR', 'MVR', 'GTQ', 'IQD', 'TRY', 'ERN', 'TOP', 'TWD', 'LYD', 'BDT', 'INR', 'CLF', 'ZWL', 'XPF', 'MOP', 'LKR', 'PLN', 'IRR', 'HRK', 'GYD', 'DOP', 'UGX', 'BZD', 'IDR', 'AWG', 'GHS', 'IMP', 'BND', 'MGA', 'DJF', 'ARS', 'MWK', 'COP', 'DKK', 'UYU', 'HUF', 'NOK', 'AED', 'XAG', 'LBP', 'KHR', 'MUR', 'HTG', 'AUD', 'LVL', 'RON', 'ETB', 'ISK', 'NZD', 'RSD', 'THB', 'SYP', 'RWF', 'VND', 'CAD', 'MMK', 'GIP', 'BOB', 'MAD', 'KES', 'SAR', 'BTN', 'WST', 'NIO', 'GNF', 'BHD', 'NGN', 'UZS', 'USD', 'GEL', 'BWP', 'CZK', 'SVC', 'FJD', 'JEP', 'CLP', 'EEK', 'BBD', 'JPY', 'BSD', 'CUP', 'SCR', 'XAU', 'TND', 'YER', 'AMD', 'PKR', 'GGP', 'SLL', 'CUC', 'PAB', 'LRD', 'SEK', 'BRL', 'MDL', 'ZMW', 'ALL', 'SOS', 'TZS', 'BAM', 'CDF', 'KRW', 'SDG', 'UAH', 'KYD', 'FKP', 'XAF', 'SGD', 'VEF', 'LAK', 'QAR', 'MKD', 'PEN', 'CHF', 'MRO', 'ILS', 'AFN', 'ZAR', 'SHP', 'HNL', 'KMF', 'XOF', 'HKD', 'GBP', 'EGP', 'BMD', 'AOA', 'PYG', 'SRD', 'BTC', 'EUR', 'JOD', 'NPR', 'KZT', 'CNY', 'KGS', 'ZMK', 'LSL', 'GMD', 'MNT', 'OMR', 'BIF', 'NAD', 'SZL', 'JMD', 'SBD', 'KPW', 'RUB', 'TMT'])

快速修復-使用其decode方法,將從http獲得的原始字節解碼為文本:

import urllib, json
url = 'http://openexchangerates.org/api/currencies.json'
response = urllib.request.urlopen(url);
data = json.loads(response.read().decode("utf-8"))
print(data)

長期解決方案:與實際字節相比,了解什么是文本數據(和unicode),是通過網絡協議實際發送,存儲在磁盤和數據庫等上的0-256范圍內的數字,通常表示文本。 為此,我強烈建議您閱讀本文:

http://www.joelonsoftware.com/articles/Unicode.html

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM