python中的“否定”模式匹配

Question

我有以下輸入，

OK SYS 10 LEN 20 12 43
1233a.fdads.txt,23 /data/a11134/a.txt
3232b.ddsss.txt,32 /data/d13f11/b.txt
3452d.dsasa.txt,1234 /data/c13af4/f.txt
.

我想提取除包含“ OK SYS 10 LEN 20 ”的行和包含單個"."的最后一行之外的所有輸入"." （點）。 也就是說，我想提取以下內容

1233a.fdads.txt,23 /data/a11134/a.txt
3232b.ddsss.txt,32 /data/d13f11/b.txt
3452d.dsasa.txt.1234 /data/c13af4/f.txt

我嘗試了以下，

for item in output:
    matchObj = re.search("^(?!OK) | ^(?!\\.)", item)
    if matchObj:
        print "got item "  + item

但它不起作用，因為它不產生任何輸出。

Answer 1

看看它在行動：

matchObj = re.search("^(?!OK|\\.).*", item)

不要忘記在否定前瞻之后放置.* ，否則您將無法獲得任何匹配 ;-)

Answer 2

 if not (line.startswith("OK ") or line.strip() == "."):
     print line

Answer 3

使用否定匹配。 （另請注意，默認情況下，正則表達式中的空格很重要，因此不要將內容隔開。或者，使用re.VERBOSE 。）

for item in output:
    matchObj = re.search("^(OK|\\.)", item)
    if not matchObj:
        print "got item " + item

Answer 4

為什么不匹配 OK SYS 行而不返回它。

for item in output:
    matchObj = re.search("(OK SYS|\\.).*", item)
    if not matchObj:
        print "got item "  + item

Answer 5

如果這是一個文件，您可以簡單地跳過第一行和最后一行，並使用csv閱讀其余部分：

>>> s = """OK SYS 10 LEN 20 12 43
... 1233a.fdads.txt,23 /data/a11134/a.txt
... 3232b.ddsss.txt,32 /data/d13f11/b.txt
... 3452d.dsasa.txt,1234 /data/c13af4/f.txt
... ."""
>>> stream = StringIO.StringIO(s)
>>> rows = [row for row in csv.reader(stream,delimiter=',') if len(row) == 2]
>>> rows
[['1233a.fdads.txt', '23 /data/a11134/a.txt'], ['3232b.ddsss.txt', '32 /data/d13f11/b.txt'], ['3452d.dsasa.txt', '1234 /data/c13af4/f.txt']]

如果它是一個文件，那么你可以這樣做：

with open('myfile.txt','r') as f:
   rows = [row for row in csv.reader(f,delimiter=',') if len(row) == 2]

Answer 6

and(re.search("bla_bla_pattern", str_item, re.IGNORECASE) == None)

正在工作。

Answer 7

你也可以在沒有負面展望的情況下做到這一點。 您只需要在要提取的表達式部分添加括號。 這個帶括號的結構被命名為group 。

讓我們編寫python代碼：

string = """OK SYS 10 LEN 20 12 43
1233a.fdads.txt,23 /data/a11134/a.txt
3232b.ddsss.txt,32 /data/d13f11/b.txt
3452d.dsasa.txt,1234 /data/c13af4/f.txt
.
"""

search_result = re.search(r"^OK.*\n((.|\s)*).", string)

if search_result:
    print(search_result.group(1))

輸出是：

1233a.fdads.txt,23 /data/a11134/a.txt
3232b.ddsss.txt,32 /data/d13f11/b.txt
3452d.dsasa.txt,1234 /data/c13af4/f.txt

^OK.*\\n會找到帶有 OK 語句的第一行，但我們不想提取它，所以不要把它放在括號里。 接下來是我們要捕獲的部分： ((.|\\s)*) ，因此將其放在括號內。 在 regexp 的末尾，我們尋找一個點. ，但我們也不想捕獲它。

PS：我發現這個答案對於理解群體的力量非常有幫助。 https://stackoverflow.com/a/3513858/4333811

Answer 8

如果 OK 行是第一行，最后一行是點，您可以考慮像這樣將它們切掉：

TestString = '''OK SYS 10 LEN 20 12 43
1233a.fdads.txt,23 /data/a11134/a.txt
3232b.ddsss.txt,32 /data/d13f11/b.txt
3452d.dsasa.txt,1234 /data/c13af4/f.txt
.
'''
print('\n'.join(TestString.split()[1:-1]))

但是，如果這是一個非常大的字符串，您可能會遇到內存問題。

python中的“否定”模式匹配

問題描述

8 個解決方案

解決方案1
52 已采納 2012-08-23 12:25:43

解決方案2
6 2012-08-23 12:08:28

解決方案3
6 2012-08-23 12:15:10

解決方案4
4 2012-08-23 12:08:31

解決方案5
1 2012-08-23 12:09:33

解決方案6
0 2015-05-01 15:38:10

解決方案7
0 2018-11-28 09:58:54

解決方案8
0 2020-05-06 08:23:41

python中的“否定”模式匹配

問題描述

8 個解決方案

解決方案1 52 已采納 2012-08-23 12:25:43

解決方案2 6 2012-08-23 12:08:28

解決方案3 6 2012-08-23 12:15:10

解決方案4 4 2012-08-23 12:08:31

解決方案5 1 2012-08-23 12:09:33

解決方案6 0 2015-05-01 15:38:10

解決方案7 0 2018-11-28 09:58:54

解決方案8 0 2020-05-06 08:23:41

解決方案1
52 已采納 2012-08-23 12:25:43

解決方案2
6 2012-08-23 12:08:28

解決方案3
6 2012-08-23 12:15:10

解決方案4
4 2012-08-23 12:08:31

解決方案5
1 2012-08-23 12:09:33

解決方案6
0 2015-05-01 15:38:10

解決方案7
0 2018-11-28 09:58:54

解決方案8
0 2020-05-06 08:23:41