Python：Pandas Dataframe使用通配符在列中查找字符串并保留行

Question

I have a pandas data frame. 我有一个熊猫数据框。 Below is a sample table. 下面是一个示例表。

Event   Text
A       something/AWAIT hello          
B       la de la
C       AWAITING SHIP
D       yes NO AWAIT

I want to only keep rows that contain some form of the word AWAIT in the Text column. 我只想在“文本”列中保留包含某种形式的单词AWAIT的行。 Below is my desired table: 下面是我想要的表：

Event   Text
A       something/AWAIT hello          
C       AWAITING SHIP
D       yes NO AWAIT

Below is the code I tried to capture strings that contain AWAIT in all possible circumstances. 以下是我试图在所有可能的情况下捕获包含AWAIT的字符串的代码。

df_STH001_2 = df_STH001[df_STH001['Text'].str.contains("?AWAIT?") == True]

The error I get is as follows: 我得到的错误如下：

error: nothing to repeat at position 0

Answer 1

Series.str.contains(pat, case=True, flags=0, na=nan, regex=True) per default treats pat as a RegEx. 每个默认值的Series.str.contains（pat，case = True，flags = 0，na = nan，regex = True）将pat视为RegEx。

The question mark ( ? ) makes the preceding token in the regular expression optional, hence the error message. 问号（ ? ）使正则表达式中的前一个标记为可选，因此出现错误消息。

In [178]: d[d['Text'].str.contains('AWAIT')]
Out[178]:
  Event                   Text
0     A  something/AWAIT hello
2     C          AWAITING SHIP
3     D           yes NO AWAIT

Answer 2

您也可以尝试match方法：

df[df.column.str.match('some_string')]

Python：Pandas Dataframe使用通配符在列中查找字符串并保留行

问题描述

2 个解决方案

解决方案1
0 已采纳 2018-03-12 16:30:12

解决方案2
0 2019-07-07 10:33:13

Python：Pandas Dataframe使用通配符在列中查找字符串并保留行

问题描述

2 个解决方案

解决方案1 0 已采纳 2018-03-12 16:30:12

解决方案2 0 2019-07-07 10:33:13

解决方案1
0 已采纳 2018-03-12 16:30:12

解决方案2
0 2019-07-07 10:33:13