搜索數據框中多列中的最后一次出現

Question

假設我有一個類似於下面結構的大型數據幀

 home| away|  home_score| away_score
    A|    B|           1|          0
    B|    C|           1|          1
    C|    A|           1|          0

我想找到最后的分數，無論家里/外。 例如，團隊A，B和C的最后得分分別為0,1和1，並填充回原始數據幀：

 home| away|  home_score| away_score| last_score_home| last_score_away|
    A|    B|           1|          0|                |                |
    B|    C|           1|          1|               0|                |
    C|    A|           1|          0|               1|               1|
 ...

我嘗試過groupby和shift，但我不確定如何結合主/結果。

Answer 1

你可以試試這個。 1）通過在前兩列名稱中添加后綴，使所有列名可拆分; 2）拆分列標題並將其轉換為多索引; 3）融合表到長格式與stack ，由團隊分組並獲得最新分數：

df.columns = df.columns.str.replace("^([^_]+)$", "\\1_team").str.split("_", expand=True)
df.stack(level=0).groupby("team").tail(1)

#         score   team
#1  home      1      B
#2  away      0      A
#   home      1      C

更新：

要將其合並回原始數據框，您可以使用join ：

df.columns = df.columns.str.replace("^([^_]+)$", "\\1_team").str.split("_", expand=True)
df1 = df.stack(level=0).groupby("team").tail(1)   

# join the result back to the original transformed data frame 
df2 = df.stack(level=0).join(df1.score, rsuffix = "_last").unstack(level=1)
df2.columns = [x + "_" + y for x, y in df2.columns]
df2

搜索數據框中多列中的最后一次出現

問題描述

1 個解決方案

解決方案1
4 2017-02-27 14:56:18

搜索數據框中多列中的最后一次出現

問題描述

1 個解決方案

解決方案1 4 2017-02-27 14:56:18

解決方案1
4 2017-02-27 14:56:18