[英]regex capturing multiple words in between two chosen words python
我對正則表達式相當陌生,無法理解我做錯了什么。
我有不同的關於女性的推文,並試圖捕捉包含單詞的句子。
一段文字的例子: all women should be earning less within the workplace if you ask me
我試圖吸引women should be earning less within the workplace
並嘗試了幾種正則表達式模式,包括:
women(\w+\W+\s*\S*)workplace
women(\w+\W+\s*\S*){2,}workplace
\bwomen(\w+\W+\s*\S*){2,}workplace\b
據我了解,此代碼應捕獲無限數量的單詞字符、空格或非空白字符至少兩次或更多。 我還使用了邊界錨來查看這是否可行,但它沒有。
但是我根本沒有收到任何匹配。 有人可以解釋一下我做錯了什么嗎。
謝謝。
如果您試圖捕獲兩個關鍵字之間的所有內容,請嘗試以下操作:
\bwomen\b.*\bworkplace\b
要捕獲包含兩個關鍵字的整個句子,請使用以下內容:
\b[^.??]*.\bwomen\b?*.\bworkplace\b[^??!]*\b
這假設句子用 分隔.
, ?
, 或!
. 它還會錯誤地將諸如Ms.
之類的縮寫中的標點符號識別為句子邊界。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.