正則表達式匹配后跟空格或標點符號的單詞

Question

如果我有india這個詞

匹配"india." "india!" "india." "india" "india." "india!" "india." "india"

不匹配"indian" "indiana"

基本上，我想匹配字符串，但不是當它包含在另一個字符串中時。

在做了一些研究之后，我開始

exp = "(?<?\S)india(.!\S)" num_matches = len(re.findall(exp))

但這與標點符號不匹配，我不確定在哪里添加。

Answer 1

假設目標是匹配字符串中的給定單詞（例如"india" ），前提是該單詞的前面和后面都沒有不在字符串".,?;;"中的字符。 您可以使用以下正則表達式：

(?<![^ .,?!;])india(?![^ .,?!;\r\n])

演示

Python 的正則表達式引擎執行以下操作

(?<!             # begin a negative lookbehind
  [^ .,?!;]      # match 1 char other than those in " .,?!;"
)                # end the negative lookbehind
india            # match string
(?!              # begin a negative lookahead   
  [^ .,?!;\r\n]  # match 1 char other than those in " .,?!;\r\n"
)                # end the negative lookahead

請注意，如果india位於行尾，則負前瞻中的字符 class 包含\r和\n 。

Answer 2

嘗試：

r'\bindia\W*\b'

查看演示

忽略大小寫：

re.search(r'\bindia\W*\b', my_string, re.IGNORECASE).group(0)

Answer 3

你可以使用：

import re

s = "india."
s1 = "indiana"
print(re.search(r'\bindia[.!?]*\b', s))
print(re.search(r'\bindia[.!?]*\b', s1))

output：

<re.Match object; span=(0, 5), match='india'>
None

Answer 4

\"india(\W*?)\"

這將捕獲除數字和字母之外的任何內容

Answer 5

試試這個^india[^a-zA-Z0-9]$

^ - 正則表達式從印度開始

[^a-zA-Z0-9] - 不是 az, AZ, 0-9

$ - 結束正則表達式

Answer 6

如果您還想匹配標點符號，您可以使用否定字符 class來匹配除單詞字符或換行符之外的任何字符。

(?<!\S)india[^\w\r\n]*(?!\S)

(?<!\S)在左邊斷言一個空白邊界
india從字面上匹配
[^\w\r\n]匹配除單詞 char 或換行符以外的任何字符 0+ 次
(?!\S)斷言右邊的空白邊界

正則表達式演示

正則表達式匹配后跟空格或標點符號的單詞

問題描述

6 個解決方案

解決方案1
2 已采納 2020-04-03 20:12:56

解決方案2
1 2020-04-03 18:02:05

解決方案3
1 2020-04-03 18:02:22

解決方案4
1 2020-04-03 18:10:06

解決方案5
1 2020-04-03 18:10:15

解決方案6
1 2020-04-04 09:07:47

正則表達式匹配后跟空格或標點符號的單詞

問題描述

6 個解決方案

解決方案1 2 已采納 2020-04-03 20:12:56

解決方案2 1 2020-04-03 18:02:05

解決方案3 1 2020-04-03 18:02:22

解決方案4 1 2020-04-03 18:10:06

解決方案5 1 2020-04-03 18:10:15

解決方案6 1 2020-04-04 09:07:47

解決方案1
2 已采納 2020-04-03 20:12:56

解決方案2
1 2020-04-03 18:02:05

解決方案3
1 2020-04-03 18:02:22

解決方案4
1 2020-04-03 18:10:06

解決方案5
1 2020-04-03 18:10:15

解決方案6
1 2020-04-04 09:07:47