[英]How to convert pandas dataframe(series) to dict
請幫助操作 dataframe pandas。
我有這樣的查詢和 pandas 一個日期框:
sql_query = pd.read_sql_query(query, connection)
df = pd.DataFrame(sql_query, columns=['id', 'w_id', 'w_date_from', 'w_date_to', 'br_id'])
df['w_date_from'] = pd.to_datetime(df['w_date_from'].dt.tz_convert('Europe/Moscow'))
df['w_date_from'] = df['w_date_from'].dt.strftime('%H:%M')
df['w_date_to'] = df['w_date_to'].dt.day_name()
df = df.groupby(
['w_date_to', 'w_date_from']
)['br_id', 'w_id'].agg(['nunique']).rename_axis(['weekday', 'time'])
df['percent'] = df['br_id'] / df['w_id']
del df['br_id']
del df['w_id']
print(df)
這段代碼的結果是這樣的:
percent
weekday time
Friday 07:40 9.666667
09:30 7.000000
10:30 9.750000
... ...
Wednesday 15:10 6.833333
16:30 14.166667
18:30 26.166667
[81 rows x 1 columns]
我需要做出這樣的結果:
"weekday_time": {
"Friday": {
"07:40": 7.67,
"09:30": 8.0,
"10:30": 5.0
},
...
"Wednesday": {
"10:30": 14.0,
"11:50": 8.43,
"13:00": 12.5
}
},
您可以使用 pandas 的內置to_dict()
方法。
要將您的多級索引轉換為您想要的格式,如果有兩個級別,您可以首先使用 unstack unstack()
將該系列轉換為 dataframe 。
您希望第一級是天,第二級是小時,因此您必須取消堆疊第 0 級而不是 -1 級。
以下應該可以解決問題:
df["percent"].unstack(level=0).to_dict()
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.