[英]How to convert pandas dataframe(series) to dict
请帮助操作 dataframe pandas。
我有这样的查询和 pandas 一个日期框:
sql_query = pd.read_sql_query(query, connection)
df = pd.DataFrame(sql_query, columns=['id', 'w_id', 'w_date_from', 'w_date_to', 'br_id'])
df['w_date_from'] = pd.to_datetime(df['w_date_from'].dt.tz_convert('Europe/Moscow'))
df['w_date_from'] = df['w_date_from'].dt.strftime('%H:%M')
df['w_date_to'] = df['w_date_to'].dt.day_name()
df = df.groupby(
['w_date_to', 'w_date_from']
)['br_id', 'w_id'].agg(['nunique']).rename_axis(['weekday', 'time'])
df['percent'] = df['br_id'] / df['w_id']
del df['br_id']
del df['w_id']
print(df)
这段代码的结果是这样的:
percent
weekday time
Friday 07:40 9.666667
09:30 7.000000
10:30 9.750000
... ...
Wednesday 15:10 6.833333
16:30 14.166667
18:30 26.166667
[81 rows x 1 columns]
我需要做出这样的结果:
"weekday_time": {
"Friday": {
"07:40": 7.67,
"09:30": 8.0,
"10:30": 5.0
},
...
"Wednesday": {
"10:30": 14.0,
"11:50": 8.43,
"13:00": 12.5
}
},
您可以使用 pandas 的内置to_dict()
方法。
要将您的多级索引转换为您想要的格式,如果有两个级别,您可以首先使用 unstack unstack()
将该系列转换为 dataframe 。
您希望第一级是天,第二级是小时,因此您必须取消堆叠第 0 级而不是 -1 级。
以下应该可以解决问题:
df["percent"].unstack(level=0).to_dict()
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.