Pandas 僅基於兩個索引級別匹配的多索引減法

Question

假設我有一個包含 3 個索引的 Pandas 多索引數據框：

import pandas as pd
import numpy as np
arrays = [['UK', 'UK', 'US', 'FR'], ['Firm1', 'Firm1', 'Firm2', 'Firm1'], ['Andy', 'Peter', 'Peter', 'Andy']]
idx = pd.MultiIndex.from_arrays(arrays, names = ('Country', 'Firm', 'Responsible'))
df_3idx = pd.DataFrame(np.random.randn(4,3), index = idx)
df_3idx
                                  0         1         2
Country Firm  Responsible                              
UK      Firm1 Andy         0.237655  2.049636  0.480805
              Peter        1.135344  0.745616 -0.577377
US      Firm2 Peter        0.034786 -0.278936  0.877142
FR      Firm1 Andy         0.048224  1.763329 -1.597279

我還有另一個 pd.dataframe，由上述數據中多索引級別 1 和 2 的獨特組合組成：

arrays = [['UK', 'US', 'FR'], ['Firm1', 'Firm2', 'Firm1']]
idx = pd.MultiIndex.from_arrays(arrays, names = ('Country', 'Firm'))
df_2idx = pd.DataFrame(np.random.randn(3,1), index = idx)
df_2idx
                      0
Country Firm           
UK      Firm1 -0.103828
US      Firm2  0.096192
FR      Firm1 -0.686631

我想用df_3idx中的相應值減去df_2idx中的值，因此，例如，我想從前兩行的每個值中減去值 -0.103828，因為兩個數據幀中的索引 1 和 2 都匹配。

有人知道怎么做這個嗎？ 我想我可以簡單地拆開第一個 dataframe 然后減去，但我收到一條錯誤消息。

df_3idx.unstack('Responsible').sub(df_2idx, axis=0)

ValueError: cannot join with no overlapping index names

無論如何，取消堆疊可能不是一個更好的解決方案，因為我的數據非常大並且取消堆疊可能需要很多時間。

我將不勝感激任何幫助。 提前謝謝了！

Answer 1

相關問題但不關注MultiIndex

但是，答案並不真正在乎。 sub方法將對齊匹配的索引級別。

pd.DataFrame.sub參數axis=0

df_3idx.sub(df_2idx[0], axis=0)

                                  0         1         2
Country Firm  Responsible                              
FR      Firm1 Andy         0.027800  3.316148  0.804833
UK      Firm1 Andy        -2.009797 -1.830799 -0.417737
              Peter       -1.174544  0.644006 -1.150073
US      Firm2 Peter       -2.211121 -3.825443 -4.391965

Pandas 僅基於兩個索引級別匹配的多索引減法

問題描述

1 個解決方案

解決方案1
1 已采納 2022-03-29 15:34:00

Pandas 僅基於兩個索引級別匹配的多索引減法

問題描述

1 個解決方案

解決方案1 1 已采納 2022-03-29 15:34:00

解決方案1
1 已采納 2022-03-29 15:34:00