如何将 pandas 数据帧（系列）转换为字典

Question

请帮助操作 dataframe pandas。

我有这样的查询和 pandas 一个日期框：

    sql_query = pd.read_sql_query(query, connection)
    df = pd.DataFrame(sql_query, columns=['id', 'w_id', 'w_date_from', 'w_date_to', 'br_id'])
    df['w_date_from'] = pd.to_datetime(df['w_date_from'].dt.tz_convert('Europe/Moscow'))
    df['w_date_from'] = df['w_date_from'].dt.strftime('%H:%M')
    df['w_date_to'] = df['w_date_to'].dt.day_name()

    df = df.groupby(
        ['w_date_to', 'w_date_from']
    )['br_id', 'w_id'].agg(['nunique']).rename_axis(['weekday', 'time'])
    df['percent'] = df['br_id'] / df['w_id']
    del df['br_id']
    del df['w_id']
    print(df)

这段代码的结果是这样的：

                   percent
                          
weekday   time            
Friday    07:40   9.666667
          09:30   7.000000
          10:30   9.750000
...                    ...
Wednesday 15:10   6.833333
          16:30  14.166667
          18:30  26.166667

[81 rows x 1 columns]

我需要做出这样的结果：

"weekday_time": {
        "Friday": {
            "07:40": 7.67,
            "09:30": 8.0,
            "10:30": 5.0
        },
        
        ...

        "Wednesday": {
            "10:30": 14.0,
            "11:50": 8.43,
            "13:00": 12.5
        }
    },

Answer 1

您可以使用 pandas 的内置to_dict()方法。

要将您的多级索引转换为您想要的格式，如果有两个级别，您可以首先使用 unstack unstack()将该系列转换为 dataframe 。

您希望第一级是天，第二级是小时，因此您必须取消堆叠第 0 级而不是 -1 级。

以下应该可以解决问题：

df["percent"].unstack(level=0).to_dict()

如何将 pandas 数据帧（系列）转换为字典

问题描述

1 个解决方案

解决方案1
0 2021-05-31 14:41:15

如何将 pandas 数据帧（系列）转换为字典

问题描述

1 个解决方案

解决方案1 0 2021-05-31 14:41:15

解决方案1
0 2021-05-31 14:41:15