格式化和解碼Twitter流JSON輸出

Question

我在格式化和編碼使用我編寫的python腳本收集的twitter流時遇到麻煩。 輸出看起來像這樣：

{“ created_at”：“ 2014年5月7日星期三20:53:05 +0000”，“ id”：464145921098674177，“ id_str”：“ 464145921098674177” ...

...，並沿一行繼續進行此單個條目。 每行都是一條推文，具有大量相同結構的信息。

我已經嘗試過簡單地使用python的JSON模塊將json文件轉換為字典，但是它一直給我一個錯誤-指出該結構不是JSON序列化。

最終，我想將JSON輸出輸入為表格格式。 我正在嘗試將文件放入csv，然后從那里去。 在這一點上，我會滿足於任何可讀性。 僅供參考-我想堅持使用Python，因為這是我所知道的。

這是我嘗試使用的python代碼：

導入json

json_file = open（'twitterOutput.json'，'r'）。readlines（）

j = json.loads（json_file [0]）

打印j

這給了我錯誤：“無法解碼JSON對象”。 僅供參考-這只是測試代碼。 我只是想嘗試使json_file列表中的一行起作用。

謝謝。

Answer 1

在不看到任何代碼的情況下很難分辨出哪里出了問題，但是應該執行以下操作：

import json

twitter_output = # string of twitter output
twitter_output_dict = json.loads(twitter_output)

或者，如果輸出存儲在文件中，則：

import json

with open('twitter_output.json') as twitter_output_file:
    twitter_output_dict = json.load(twitter_output_file)

至於“試圖將文件放入一個csv並從那里去”，您將不得不解釋如何實現該目標以及如何對其進行結構化。 據我所知，Twitter返回的JSON是一個嵌套結構（如在Twitter的文檔中所見，因此以csv格式顯示它實際上取決於您要如何構造它。