用于文本的简单过滤器Python脚本

Question

我正在尝试创建必须是一个简单的过滤器函数的函数，该函数针对文本文件运行一个正则表达式并返回包含该特定正则表达式的所有单词。

因此，例如，如果我想找到包含“ABC”的所有文字，我有名单： abcde ， bce ， xyz和zyxabc脚本将返回abcde和zyxabc 。

我在下面有一个脚本，但是我不确定它是否只是我失败的正则表达式。 它只会返回abc两次，而不是完整的单词。 谢谢。

import re

text = open("test.txt", "r")
regex = re.compile(r'(abc)')

for line in text:
    target = regex.findall(line)
    for word in target:
        print word

Answer 1

我认为您不需要正则表达式来执行此任务，您只需split行即可创建单词列表，然后遍历单词列表并in operator中使用：

 with open("test.txt") as f :
     for line in f:
         for w in line.split():
              if 'abc' in w :
                   print w

Answer 2

您的方法正确，但是您可以将Regex更改为r'.*abc.*'

 regex = re.compile(r'.*abc.*')

这将匹配其中所有带有abc的行The wildcards 。*`将匹配该行中的所有字母。

更改了特定行的小演示将打印

abcde
zyxabc

注意，正如Kasra所提到的，在这种情况下最好in运算符中使用

用于文本的简单过滤器Python脚本

问题描述

2 个解决方案

解决方案1
2 已采纳 2015-03-25 19:58:25

解决方案2
2 2015-03-25 19:59:41

用于文本的简单过滤器Python脚本

问题描述

2 个解决方案

解决方案1 2 已采纳 2015-03-25 19:58:25

解决方案2 2 2015-03-25 19:59:41

解决方案1
2 已采纳 2015-03-25 19:58:25

解决方案2
2 2015-03-25 19:59:41