[英]python pandas multiindex subtract rows with matching level 1 index
[英]Pandas Multiindex subtract based on only two index level matchings
假設我有一個包含 3 個索引的 Pandas 多索引數據框:
import pandas as pd
import numpy as np
arrays = [['UK', 'UK', 'US', 'FR'], ['Firm1', 'Firm1', 'Firm2', 'Firm1'], ['Andy', 'Peter', 'Peter', 'Andy']]
idx = pd.MultiIndex.from_arrays(arrays, names = ('Country', 'Firm', 'Responsible'))
df_3idx = pd.DataFrame(np.random.randn(4,3), index = idx)
df_3idx
0 1 2
Country Firm Responsible
UK Firm1 Andy 0.237655 2.049636 0.480805
Peter 1.135344 0.745616 -0.577377
US Firm2 Peter 0.034786 -0.278936 0.877142
FR Firm1 Andy 0.048224 1.763329 -1.597279
我還有另一個 pd.dataframe,由上述數據中多索引級別 1 和 2 的獨特組合組成:
arrays = [['UK', 'US', 'FR'], ['Firm1', 'Firm2', 'Firm1']]
idx = pd.MultiIndex.from_arrays(arrays, names = ('Country', 'Firm'))
df_2idx = pd.DataFrame(np.random.randn(3,1), index = idx)
df_2idx
0
Country Firm
UK Firm1 -0.103828
US Firm2 0.096192
FR Firm1 -0.686631
我想用df_3idx
中的相應值減去df_2idx
中的值,因此,例如,我想從前兩行的每個值中減去值 -0.103828,因為兩個數據幀中的索引 1 和 2 都匹配。
有人知道怎么做這個嗎? 我想我可以簡單地拆開第一個 dataframe 然后減去,但我收到一條錯誤消息。
df_3idx.unstack('Responsible').sub(df_2idx, axis=0)
ValueError: cannot join with no overlapping index names
無論如何,取消堆疊可能不是一個更好的解決方案,因為我的數據非常大並且取消堆疊可能需要很多時間。
我將不勝感激任何幫助。 提前謝謝了!
但是,答案並不真正在乎。 sub
方法將對齊匹配的索引級別。
pd.DataFrame.sub
參數axis=0
df_3idx.sub(df_2idx[0], axis=0)
0 1 2
Country Firm Responsible
FR Firm1 Andy 0.027800 3.316148 0.804833
UK Firm1 Andy -2.009797 -1.830799 -0.417737
Peter -1.174544 0.644006 -1.150073
US Firm2 Peter -2.211121 -3.825443 -4.391965
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.