是否可以根據索引和列名合並兩個 pandas 數據幀？

Question

我有兩個數據框：

left = pd.DataFrame(
        {
            "Col": ["D", "C", "B", "A"],
        },
        index=[0, 1, 2, 3],
    )
right = pd.DataFrame(
        {
            "A": ["A0", "A1", "A2", "A3"],
            "B": ["B0", "B1", "B2", "B3"],
            "C": ["C0", "C1", "C2", "C3"],
            "D": ["D0", "D1", "D2", "D3"],
        },
        index=[0, 1, 2, 3],
    )

是否可以根據左側的索引和col以及右側的列名合並它們？

我需要得到以下結果：

result = pd.DataFrame(
        {
            "Col": ["D", "C", "B", "A"],
            "Val": ["D0", "C1", "B2", "A3"],
        },
    )

Answer 1

嘗試

left['new'] = right.values[np.arange(len(left)), right.columns.get_indexer(left.Col)]
left
Out[129]: 
  Col new
0   D  D0
1   C  C1
2   B  B2
3   A  A3

請注意，我們曾經進行過lookup ，但已棄用，以上是numpy lookup的替代方法之一

這里我沒有使用index的原因： numpy沒有索引，所以我們需要 position 傳遞正確的值，大部分時間索引與 position 相同，但可能會有所不同。

Answer 2

另一種解決方案：

left["new"] = right.apply(lambda x: x[left.loc[x.name, "Col"]], axis=1)
print(left)

印刷：

  Col new
0   D  D0
1   C  C1
2   B  B2
3   A  A3

Answer 3

替代方法（使用melt將列轉換為索引，然后merge ）：

left['id'] = left.index    
m = right.melt(ignore_index=False, var_name="Col", value_name="Val")
m['id'] = m.index    
result = pd.merge(left, m, on=["id", "Col"])[["Col", "Val"]]

它比使用apply快，但比接受的答案慢。

是否可以根據索引和列名合並兩個 pandas 數據幀？

問題描述

3 個解決方案

解決方案1
4 已采納 2021-05-24 18:27:37

解決方案2
2 2021-05-24 18:37:26

解決方案3
1 2021-05-25 10:13:02

是否可以根據索引和列名合並兩個 pandas 數據幀？

問題描述

3 個解決方案

解決方案1 4 已采納 2021-05-24 18:27:37

解決方案2 2 2021-05-24 18:37:26

解決方案3 1 2021-05-25 10:13:02

解決方案1
4 已采納 2021-05-24 18:27:37

解決方案2
2 2021-05-24 18:37:26

解決方案3
1 2021-05-25 10:13:02