簡體   English   中英

正則表達式在兩個選定的單詞之間捕獲多個單詞 python

[英]regex capturing multiple words in between two chosen words python

我對正則表達式相當陌生,無法理解我做錯了什么。

我有不同的關於女性的推文,並試圖捕捉包含單詞的句子。

一段文字的例子: all women should be earning less within the workplace if you ask me

我試圖吸引women should be earning less within the workplace並嘗試了幾種正則表達式模式,包括:

women(\w+\W+\s*\S*)workplace
women(\w+\W+\s*\S*){2,}workplace
\bwomen(\w+\W+\s*\S*){2,}workplace\b

據我了解,此代碼應捕獲無限數量的單詞字符、空格或非空白字符至少兩次或更多。 我還使用了邊界錨來查看這是否可行,但它沒有。

但是我根本沒有收到任何匹配。 有人可以解釋一下我做錯了什么嗎。

謝謝。

如果您試圖捕獲兩個關鍵字之間的所有內容,請嘗試以下操作:

\bwomen\b.*\bworkplace\b

要捕獲包含兩個關鍵字的整個句子,請使用以下內容:

\b[^.??]*.\bwomen\b?*.\bworkplace\b[^??!]*\b

這假設句子用 分隔. , ? , 或! . 它還會錯誤地將諸如Ms.之類的縮寫中的標點符號識別為句子邊界。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM