以最有效的方式對 Pandas Dataframe 進行排序和過濾

Question

我想按列名“持續時間”進行過濾，然后顯示大於 200 的值。這只是數據集的一個片段。 我有一個非常龐大的數據集。 我可以使用 df[df.duration > 200]。 但是，這在整個 dataframe 上運行。 有什么方法可以專門針對列持續時間，然后過濾數據並僅顯示列持續時間而不引入新的 dataframe。 還有一些與在大型數據集（工作環境）中優化相同的解釋會有所幫助。

import pandas as pd
data = {
  "calories": [420, 380, 390,100],
  "duration": [50, 40, 45,300]
}
df = pd.DataFrame(data)

Answer 1

使用 pandas，我認為df[df.duration > 200]將是最佳選擇之一，但渴望與任何替代品進行比較。

以最有效的方式對 Pandas Dataframe 進行排序和過濾

問題描述

1 個解決方案

解決方案1
0 2021-04-16 18:45:23

以最有效的方式對 Pandas Dataframe 進行排序和過濾

問題描述

1 個解決方案

解決方案1 0 2021-04-16 18:45:23

解決方案1
0 2021-04-16 18:45:23