熊貓過濾一列中的值

Question

我有一個這樣的數據框：

有 114 行。 CPULabel的前 6 行的CPULabel將重復 19 次。 我嘗試使用下面的命令來過濾包含字符串'Fast'或'Slow' ：

df[(df['CPULabel']=='BP100_Fast') | (df['CPULabel']=='100LoBW_Fast') | (df['CPULabel']=='100HiBW_Fast')]
df[(df['CPULabel']=='BP100_Slow') | (df['CPULabel']=='100LoBW_Slow') | (df['CPULabel']=='100HiBW_Slow')]

但有時不同的人會以不同的方式命名，唯一的共同點是字符串'Fast'或'Slow' 。 我之前試過正則快遞，沒用。 無論如何要過濾或選擇列中的某些值？ 非常感謝。

Answer 1

您可以使用正則表達式(?i)fast|(?i)slow嘗試str.contains ，這將選擇包含fast或slow字符串，忽略大小寫：

df[df['CPULabel'].str.contains("(?i)fast|(?i)slow")]

示例：

df = pd.DataFrame({"CPULabel": ["BP100_Fast", "BP100_Slow", "BP100"]})

df
#     CPULabel
#0  BP100_Fast
#1  BP100_Slow
#2       BP100

df[df['CPULabel'].str.contains("(?i)fast|(?i)slow")]

#     CPULabel
#0  BP100_Fast
#1  BP100_Slow

熊貓過濾一列中的值

問題描述

1 個解決方案

解決方案1
3 2017-02-27 21:20:48

熊貓過濾一列中的值

問題描述

1 個解決方案

解決方案1 3 2017-02-27 21:20:48

解決方案1
3 2017-02-27 21:20:48