![](/img/trans.png)
[英]Selecting rows from a Dataframe based on values in multiple columns in pandas
[英]Selecting data based on values in multiple columns in Pandas
我有以下DataFrame,我需要選擇在[f1,f2,f3,f4,f5]字段中分別具有[1,2,3,4,5]的數據。
ID f1 f2 f3 f4 f5
1 1 2 3 4 5
2 2 3 4 5 6
3 1 2 3 4 5
4 5 4 2 3 4
df = DataFrame(numpy.array([[1, 1, 2, 3, 4, 5],
[2, 2, 3, 4, 5, 6],
[3, 1, 2, 3, 4, 5],
[4, 5, 4, 2, 3, 4]], dtype=int64),
columns = ['ID','f1','f2','f3','f4','f5'])
一種明顯的方法是執行以下操作:
df[(df['f1'] == 1) & (df['f2'] == 2) & (df['f3'] == 3) & (df['f4'] == 4) & (df['f5'] == 5)]
有什么簡潔的方法嗎? 我需要做多次,並且某些其他DataFrame的字段名稱可能不同。
稍微簡單一些的方法可能是:
>>> df[(df.loc[:, 'f1':'f5'] == np.arange(1, 6)).all(1)]
ID f1 f2 f3 f4 f5
0 1 1 2 3 4 5
2 3 1 2 3 4 5
在這里df.loc[:, 'f1':'f5']
選擇列,然后對它們進行測試(逐行)與數組[1, 2, 3, 4, 5]
]是否相等。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.