將數據幀與 Pandas 合並

Question

我正在嘗試將某些數據幀合並到一個數據幀中，並使用 Pandas 填充缺失值。 一個例子如下：

import pandas as pd

data1 = {'SKU' : ['C1', 'D1'],
     'Description' : ['c2', 'd'],
     'Unit Cost' : [0.2, 1.5],
     'Qty1' : [18, 10]}
idx1 = ['RM0001', 'RM0004']

data2 = {'SKU' : ['C1', np.nan],
     'Description' : ['c', 'e'],
     'Qty2' : [15, 8]}
idx2 = ['RM0001', 'RM0010']

data3 = {'SKU' : ['D1', 'E1'],
     'Description' : ['d', 'e'],
     'Qty3' : [7, 9]}
idx3 = ['RM0004', 'RM0010']

df1 = pd.DataFrame(data1, index=idx1)
df2 = pd.DataFrame(data2, index=idx2)
df3 = pd.DataFrame(data3, index=idx3)

所需的輸出將采用以下形式：

       SKU Description  Unit Cost  Qty1  Qty2  Qty3
RM0001  C1           c        0.2  18.0  15.0   NaN
RM0004  D1           d        1.5  10.0   NaN   7.0
RM0010  E1           e        NaN   NaN   8.0   9.0

我嘗試了各種 pd.merge 和 functools.reduce 應用程序，但都沒有給我想要的輸出。 我還在學習熊貓，所以我想我錯過了一些東西，因為這不應該太復雜。 對這些步驟的一個小解釋（或一個優秀來源的鏈接）將不勝感激。

Answer 1

嘗試combine_first ，您可以將它們鏈接起來：

df1.combine_first(df2).combine_first(df3)

輸出：

       Description  Qty1  Qty2  Qty3 SKU  Unit Cost
RM0001          c2  18.0  15.0   NaN  C1        0.2
RM0004           d  10.0   NaN   7.0  D1        1.5
RM0010           e   NaN   8.0   9.0  E1        NaN

或者您可以將concat與groupby一起使用：

pd.concat([df1,df2,df3]).groupby(level=0).first()

輸出：

       SKU Description  Unit Cost  Qty1  Qty2  Qty3
RM0001  C1          c2        0.2  18.0  15.0   NaN
RM0004  D1           d        1.5  10.0   NaN   7.0
RM0010  E1           e        NaN   NaN   8.0   9.0

將數據幀與 Pandas 合並

問題描述

1 個解決方案

解決方案1
1 已采納 2021-10-29 16:22:35

將數據幀與 Pandas 合並

問題描述

1 個解決方案

解決方案1 1 已采納 2021-10-29 16:22:35

解決方案1
1 已采納 2021-10-29 16:22:35