如何：Pandas 由于 pivot 表而存在多索引时的列划分

Question

我有一个销售数据集，我将其读入 Pandas dataframe 并转向组信息。 现在列是一个多索引，看起来像这样：

MultiIndex([('Orders', 'Pants'),
        ('Orders', 'Shirts'),
        ('Orders', 'Shoes'),
        ( 'Spend', 'Pants'),
        ( 'Spend', 'Shirts'),
        ( 'Spend', 'Shoes'),,
       names=[None, 'Product'])

现在，我正在尝试计算每个“产品”的“平均订单价值”。 我想做类似的事情：

# Calculate Avg. Order Value by dividing Spend Series by Orders Series
dataframe['AOV'] = dataframe['Spend'] / dataframe['Orders']

但是我不能。 我如何以具有这些列多索引的 dataframe 结束：

MultiIndex([('Orders', 'Pants'),
            ('Orders', 'Shirts'),
            ('Orders', 'Shoes'),
            ( 'Spend', 'Pants'),
            ( 'Spend', 'Shirts'),
            ( 'Spend', 'Shoes'),
            ( 'AOV', 'Pants'),
            ( 'AOV', 'Shirts'),
            ( 'AOV', 'Shoes'),
           names=[None, 'Product'])

Answer 1

将Spend除以Orders ，然后与keys参数连接到concat称为AOV的附加索引级别，然后与原始concat连接以获得结果

AOV = pd.concat([df.loc['Spend'] / df.loc['Orders']], keys=['AOV'])
result = pd.concat([df, AOV])

或者，您可以拆开unstack然后分开并堆叠回去

s = df.unstack()
s.loc['AOV'] = s.loc['Spend'] / s.loc['Orders']
result = s.stack()

如何：Pandas 由于 pivot 表而存在多索引时的列划分

问题描述

1 个解决方案

解决方案1
1 2023-01-13 05:01:08

如何：Pandas 由于 pivot 表而存在多索引时的列划分

问题描述

1 个解决方案

解决方案1 1 2023-01-13 05:01:08

解决方案1
1 2023-01-13 05:01:08