簡體   English   中英

如何使用json文件中的“時間戳”將DataFrame從X天設置為Y天,而不是將X年設置為Y年?

[英]How can I use the “timestamps” within the json files to set the DataFrame from day X to day Y and not from year X to year Y?

我想對不同的json文件進行一些文本分析。 這些文件的名稱類似於“ 2017.json”或“ 2018.json”。

它們包含許多帶有一個時間戳的文本。 (例如,“時間戳記”:“ 2019-01-31T19:15:00”,)

熊貓的基本結構是所謂的DataFrame。 我首先創建了一個DataFrame,然后將各個年份(這里只有一年)的數據附加到它上面。 這樣可以確保所有數據都可以在同一結構中使用。

現在,我只能使用各個年份來創建DataFrame。 是否可以在文件中使用時間戳創建DataFrame(例如,從x天到y天)?

import pandas as pd

data = pd.DataFrame()

#json file 2017
for year in range (2017,2018):
    data = pd.concat([data, pd.read_json("%d.json" % year, orient="records")], ignore_index=True)

如果您知道特定范圍,則可以針對這些特定日期過濾數據框,並從中獲取新的數據框。

filtered_df = df[(df['date'] > 'from date') & (df['date'] < 'to date')]

然后,您可以保存filtered_df,並在文件名中提及from和to范圍

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM