[英]How can I use the “timestamps” within the json files to set the DataFrame from day X to day Y and not from year X to year Y?
我想對不同的json文件進行一些文本分析。 這些文件的名稱類似於“ 2017.json”或“ 2018.json”。
它們包含許多帶有一個時間戳的文本。 (例如,“時間戳記”:“ 2019-01-31T19:15:00”,)
熊貓的基本結構是所謂的DataFrame。 我首先創建了一個DataFrame,然后將各個年份(這里只有一年)的數據附加到它上面。 這樣可以確保所有數據都可以在同一結構中使用。
現在,我只能使用各個年份來創建DataFrame。 是否可以在文件中使用時間戳創建DataFrame(例如,從x天到y天)?
import pandas as pd
data = pd.DataFrame()
#json file 2017
for year in range (2017,2018):
data = pd.concat([data, pd.read_json("%d.json" % year, orient="records")], ignore_index=True)
如果您知道特定范圍,則可以針對這些特定日期過濾數據框,並從中獲取新的數據框。
filtered_df = df[(df['date'] > 'from date') & (df['date'] < 'to date')]
然后,您可以保存filtered_df,並在文件名中提及from和to范圍
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.