![](/img/trans.png)
[英]Most Efficient Way to iteratively filter a Pandas dataframe given a list of values
[英]Sort and Filter Pandas Dataframe in the most efficient manner
我想按列名“持續時間”進行過濾,然后顯示大於 200 的值。這只是數據集的一個片段。 我有一個非常龐大的數據集。 我可以使用 df[df.duration > 200]。 但是,這在整個 dataframe 上運行。 有什么方法可以專門針對列持續時間,然后過濾數據並僅顯示列持續時間而不引入新的 dataframe。 還有一些與在大型數據集(工作環境)中優化相同的解釋會有所幫助。
import pandas as pd
data = {
"calories": [420, 380, 390,100],
"duration": [50, 40, 45,300]
}
df = pd.DataFrame(data)
使用 pandas,我認為df[df.duration > 200]
將是最佳選擇之一,但渴望與任何替代品進行比較。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.