"Pandas：通過另一個數據幀的多個同時列值過濾一個數據幀"

Question

我有一個名為correct_df<\/code>的過濾數據框和一個原始數據框example_df<\/code> 。

example_df = pd.DataFrame({'Test': ['Test_1', 'Test_1', 'Test_1', 'Test_2', 'Test_2', 'Test_2', 'Test_3', 'Test_3', 'Test_3'], 'A': [1, 2, 3, 1, 2, 3, 1, 2, 3]})
other_df = pd.DataFrame({'Test': ['Test_1', 'Test_1', 'Test_3', 'Test_3'], 'A': [1, 2, 1, 3]})

Answer 1

使用DataFrame.reset_index<\/code><\/a>避免丟失索引，然后使用DataFrame.merge<\/code><\/a> ：

result = example_df.reset_index().merge(other_df, on=['Test','A'])
print (result)
   index    Test  A
0      0  Test_1  1
1      1  Test_1  2
2      6  Test_3  1
3      8  Test_3  3

Answer 2

@jezrael 的解決方案絕對適合您的問題。 這只是使用 numpy 獲得相同結果的另一種方式（有點復雜）。

我們可以直接使用布爾數組過濾example_df ，我們可以通過檢查example_df中的行是否存在other_df來構造該數組。 為此，我們需要將example_df設為 3D 數組並使用 numpy 廣播與other_df進行比較。 然后使用all和any將其縮小回一維數組msk ：

msk = (example_df.to_numpy()[:, None]==other_df.to_numpy()).all(axis=2).any(axis=1)
out = example_df[msk]

輸出：

     Test  A
0  Test_1  1
1  Test_1  2
6  Test_3  1
8  Test_3  3

"Pandas：通過另一個數據幀的多個同時列值過濾一個數據幀"

問題描述

2 個解決方案

解決方案1
2 已采納 2022-02-07 06:20:38

解決方案2
0 2022-02-07 06:49:34

"Pandas：通過另一個數據幀的多個同時列值過濾一個數據幀"

問題描述

2 個解決方案

解決方案1 2 已采納 2022-02-07 06:20:38

解決方案2 0 2022-02-07 06:49:34

解決方案1
2 已采納 2022-02-07 06:20:38

解決方案2
0 2022-02-07 06:49:34