[英]Formatting and Decoding Twitter Stream JSON Output
我在格式化和編碼使用我編寫的python腳本收集的twitter流時遇到麻煩。 輸出看起來像這樣:
{“ created_at”:“ 2014年5月7日星期三20:53:05 +0000”,“ id”:464145921098674177,“ id_str”:“ 464145921098674177” ...
...,並沿一行繼續進行此單個條目。 每行都是一條推文,具有大量相同結構的信息。
我已經嘗試過簡單地使用python的JSON模塊將json文件轉換為字典,但是它一直給我一個錯誤-指出該結構不是JSON序列化。
最終,我想將JSON輸出輸入為表格格式。 我正在嘗試將文件放入csv,然后從那里去。 在這一點上,我會滿足於任何可讀性。 僅供參考-我想堅持使用Python,因為這是我所知道的。
這是我嘗試使用的python代碼:
導入json
json_file = open('twitterOutput.json','r')。readlines()
j = json.loads(json_file [0])
打印j
這給了我錯誤:“無法解碼JSON對象”。 僅供參考-這只是測試代碼。 我只是想嘗試使json_file列表中的一行起作用。
謝謝。
在不看到任何代碼的情況下很難分辨出哪里出了問題,但是應該執行以下操作:
import json
twitter_output = # string of twitter output
twitter_output_dict = json.loads(twitter_output)
或者,如果輸出存儲在文件中,則:
import json
with open('twitter_output.json') as twitter_output_file:
twitter_output_dict = json.load(twitter_output_file)
至於“試圖將文件放入一個csv並從那里去”,您將不得不解釋如何實現該目標以及如何對其進行結構化。 據我所知,Twitter返回的JSON是一個嵌套結構(如在Twitter的文檔中所見,因此以csv格式顯示它實際上取決於您要如何構造它。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.