根據熊貓中多列中的值選擇數據

Question

我有以下DataFrame，我需要選擇在[f1，f2，f3，f4，f5]字段中分別具有[1,2,3,4,5]的數據。

ID  f1  f2  f3  f4  f5
1   1   2   3   4   5
2   2   3   4   5   6
3   1   2   3   4   5
4   5   4   2   3   4


df = DataFrame(numpy.array([[1, 1, 2, 3, 4, 5],
                            [2, 2, 3, 4, 5, 6],
                            [3, 1, 2, 3, 4, 5],
                            [4, 5, 4, 2, 3, 4]], dtype=int64), 
               columns = ['ID','f1','f2','f3','f4','f5'])

一種明顯的方法是執行以下操作：

df[(df['f1'] == 1) & (df['f2'] == 2) & (df['f3'] == 3) & (df['f4'] == 4) & (df['f5'] == 5)]

有什么簡潔的方法嗎？ 我需要做多次，並且某些其他DataFrame的字段名稱可能不同。

Answer 1

稍微簡單一些的方法可能是：

>>> df[(df.loc[:, 'f1':'f5'] == np.arange(1, 6)).all(1)]
   ID  f1  f2  f3  f4  f5
0   1   1   2   3   4   5
2   3   1   2   3   4   5

在這里df.loc[:, 'f1':'f5']選擇列，然后對它們進行測試（逐行）與數組[1, 2, 3, 4, 5] ]是否相等。

根據熊貓中多列中的值選擇數據

問題描述

1 個解決方案

解決方案1
4 已采納 2015-04-23 19:04:31

根據熊貓中多列中的值選擇數據

問題描述

1 個解決方案

解決方案1 4 已采納 2015-04-23 19:04:31

解決方案1
4 已采納 2015-04-23 19:04:31