簡體   English   中英

格式化和解碼Twitter流JSON輸出

[英]Formatting and Decoding Twitter Stream JSON Output

我在格式化和編碼使用我編寫的python腳本收集的twitter流時遇到麻煩。 輸出看起來像這樣:

{“ created_at”:“ 2014年5月7日星期三20:53:05 +0000”,“ id”:464145921098674177,“ id_str”:“ 464145921098674177” ...

...,並沿一行繼續進行此單個條目。 每行都是一條推文,具有大量相同結構的信息。

我已經嘗試過簡單地使用python的JSON模塊將json文件轉換為字典,但是它一直給我一個錯誤-指出該結構不是JSON序列化。

最終,我想將JSON輸出輸入為表格格式。 我正在嘗試將文件放入csv,然后從那里去。 在這一點上,我會滿足於任何可讀性。 僅供參考-我想堅持使用Python,因為這是我所知道的。

這是我嘗試使用的python代碼:

導入json

json_file = open('twitterOutput.json','r')。readlines()

j = json.loads(json_file [0])

打印j

這給了我錯誤:“無法解碼JSON對象”。 僅供參考-這只是測試代碼。 我只是想嘗試使json_file列表中的一行起作用。

謝謝。

在不看到任何代碼的情況下很難分辨出哪里出了問題,但是應該執行以下操作:

import json

twitter_output = # string of twitter output
twitter_output_dict = json.loads(twitter_output)

或者,如果輸出存儲在文件中,則:

import json

with open('twitter_output.json') as twitter_output_file:
    twitter_output_dict = json.load(twitter_output_file)

至於“試圖將文件放入一個csv並從那里去”,您將不得不解釋如何實現該目標以及如何對其進行結構化。 據我所知,Twitter返回的JSON是一個嵌套結構(如在Twitter的文檔中所見,因此以csv格式顯示它實際上取決於您要如何構造它。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM