根據索引和列將填充的 DataFrame 合並到掩碼中

Question

使用以下“掩碼”數據幀：

>>> mask
               city      value_1      value_2
index
0            London           10          NaN
1             Paris          NaN           21
2             Paris           30          NaN
3             Paris          NaN          NaN
4            Berlin            3            5
5            Berlin          NaN           10
6          New York          NaN          NaN

以及以下“填充”框架：

>>> filling
                value_1      value_2
London             1100         2100
Paris              1150         2200
Berlin              NaN         3000
New York           5000          NaN

如何根據city和列將filling合並到mask ，以便生成的 DataFrame 變為：

>>> result
               city      value_1      value_2
index
0            London           10         2100
1             Paris         1150           21
2             Paris           30         2200
3             Paris         1150         2200
4            Berlin            3            5
5            Berlin          NaN           10
6          New York         5000          NaN

從概念上講，從任何值mask是NaN是易於通過的值被“填充” filling其中兩個其匹配city和其列（ value_1或value_2 ）。

我正在努力解決的部分是讓DataFrame.merge()考慮到索引（這里是city ）和所有列。 兩者都可以，但要獲得預期的結果，我似乎需要兩者。

編輯：

我嘗試了以下方法：

>>> expanded = mask[[]].join(filling, on='city')
>>> mask.merge(expanded)

但這只是讓我返回mask ，並且所有來自expanded值都被簡單地忽略（即使目標單元格是NaN ）。

Answer 1

嘗試使用reindex filling fillna ：

mask.fillna(filling.reindex(mask.city).set_index(mask.index))

輸出：

           city  value_1  value_2
index                            
0        London     10.0   2100.0
1         Paris   1150.0     21.0
2         Paris     30.0   2200.0
3         Paris   1150.0   2200.0
4        Berlin      3.0      5.0
5        Berlin      NaN     10.0
6      New York   5000.0      NaN

Answer 2

DataFrame.update ，我們可以使用帶有overwrite=False DataFrame.update 。

注意：我們將方法分開在不同的行中，因為更新就位。

mask = mask.set_index("city")
mask.update(filling, overwrite=False)
mask = mask.reset_index()

       city  value_1  value_2
0    London     10.0   2100.0
1     Paris   1150.0     21.0
2     Paris     30.0   2200.0
3     Paris   1150.0   2200.0
4    Berlin      3.0      5.0
5    Berlin      NaN     10.0
6  New York   5000.0      NaN

Answer 3

您還可以使用專為此目的設計的combine_first ：

print (mask.set_index("city").combine_first(filling))

          value_1  value_2
Berlin        3.0      5.0
Berlin        NaN     10.0
London       10.0   2100.0
New York   5000.0      NaN
Paris      1150.0     21.0
Paris        30.0   2200.0
Paris      1150.0   2200.0

如果您需要保留原始順序， reset_index執行reset_index並稍后對其進行排序。

根據索引和列將填充的 DataFrame 合並到掩碼中

問題描述

3 個解決方案

解決方案1
2 已采納 2021-10-28 16:14:17

解決方案2
1 2021-10-28 16:16:45

解決方案3
1 2021-10-28 16:32:08

根據索引和列將填充的 DataFrame 合並到掩碼中

問題描述

3 個解決方案

解決方案1 2 已采納 2021-10-28 16:14:17

解決方案2 1 2021-10-28 16:16:45

解決方案3 1 2021-10-28 16:32:08

解決方案1
2 已采納 2021-10-28 16:14:17

解決方案2
1 2021-10-28 16:16:45

解決方案3
1 2021-10-28 16:32:08