創建一個以其他兩個條件為條件的變量均值的列變量

Question

我有一個數據框，顯示每個給定條件的均值'dwdime' ：

DIMExCand_means = DIMExCand.groupby(['cycle', 'coded_state', 'party.orig', 'comtype']).mean()

我使用以下命令和輸出從DIMExCand_means創建了數據透視表：

DIMExCand_master = pd.pivot_table(DIMExCand_means,index=["Cycle","State"])

但是，在此過程中一些數據會丟失。 我想在'DIMExCand_master'數據'DIMExCand_master'添加列，其中包括給定'party.orig'和'comptype'每種可能組合的平均'dwdime'得分，因為這將使我每個'cycle'-'coded_state'有一個條目'cycle'-'coded_state' 。

Answer 1

我們試試吧：

DIMExCand_means = DIMExCand_means.reset_index()
DIMExCand_master = DIMExCand_master.reset_index()

pd.merge(DIMExCand_means, DIMExCand_master, left_on=['cycle','coded_state'], right_on=['Cycle','State'])

Answer 2

謝謝！

我最終選擇了：

DIMExCand_dime = pd.pivot_table（DIMExCand，值='dwdime'，索引[“ Cycle”，“ State”]，列='ID'，aggfunc = np.mean）

創建一個以其他兩個條件為條件的變量均值的列變量

問題描述

2 個解決方案

解決方案1
1 已采納 2017-04-01 02:13:49

解決方案2
0 2017-04-02 01:27:34

創建一個以其他兩個條件為條件的變量均值的列變量

問題描述

2 個解決方案

解決方案1 1 已采納 2017-04-01 02:13:49

解決方案2 0 2017-04-02 01:27:34

解決方案1
1 已采納 2017-04-01 02:13:49

解決方案2
0 2017-04-02 01:27:34